ADD 兄弟 连 教育 组 织 编写 














苗 码 看 视频 ， 全 程 视频 教学 
e100 




















4 
稚 
册 § 


给 


超 值 专 享 小 程序 学 习 课件 
涵盖 [ 视频 教学 / 代码 示例 / 资源 包 / 扩展 知识 / 
习题 / PPT / FAQ / 作 业 ] 八大 主题 


Python 3. 


[| 








刘 宇 宙 刘 艳 编著 











汶 革 大 学 出 版 社 


Python 3.7 
从 察 开 始 学 




















所 壮大 学 出 版 社 
北京 


内 容 简 介 


本 书 专门 针对 Python 新 手 量 身 编写 ， 涵 盖 Python 3 实际 开发 的 重要 知识 点 ， 内 容 包 括 : Python 语言 的 


类 型 和 对 
件 操作 、 


象 、 操 作 符 和 表达 式 、 编 程 结构 和 控制 流 、 函 数 、 序 列 、 多 线程 、 正 则 表达 式 、 面 向 对 象 编程 、 文 
网 络 编程 、 邮 件 收发 、 数 据 库 操作 等 ， 提 供 Python 怜 虫 、 自 然 语言 处 理 、 区 块 链 项 目 范例 ， 各 章 还 





安排 了 调试 、 问 题解 答 、 温 故 知 新 、 牛 刀 小 试 等 内 容 ， 以 帮助 读者 学 会 处 理 程序 异常 、 解 答 学 习 困 惑 、 巩 固 
知识 、 学 以 致 用 。 

本 书 还 开发 了 配套 小 程序 学 习 课件 ， 课 件 中 涵盖 视频 教学 、 代 码 示例 、 资 源 包 、 扩 展 知识 、 习 题 、PPT、 
FAQ、 作 业 8 大 主题 ， 大 幅 扩展 了 本 书 知识 体系 ， 可 帮助 读者 轻松 快速 地 掌握 Python 编程 技能 。 

本 书 技术 先进 、 示 例 丰富 、 代 码 可 读 性 及 可 操作 性 强 ， 非 常 适合 Python 初学 者 和 转型 到 Python 开发 的 
程序 员 使 用 ， 也 可 作为 Python 网 课 、 培 训 机 构 及 大 专 院 校 的 教学 用 书 。 
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推 荐 序 


如 果 你 想 学习 一 门 语言 ， 我 诚挚 向 你 推荐 Python。 

Python 是 那么 优雅 ， 它 和 干净、 简洁 ， 却 又 不 失 严谨 ， 如 果 你 是 程序 员 ， 和 希望 通过 教 你 的 小 孩 
子 编程 来 锻炼 罗 辑 思维 能 力 ，Python 一 定 是 首选 ， 相 信 我 ， 这 是 最 不 “ 坑 娃 ”的 选择 。 从 职业 的 
角度 而 言 ，Python 是 典型 的 “万 金 油 ”， 它 可 以 应 用 在 Web 开发 、 人 工 智能 、 服 务 器 运 维 、 科 学 
与 数字 计算 、3D 游戏 开发 、 网 络 编程 等 众多 领域 。 无 论 是 国外 的 Google、YouTube， 还 是 国内 的 
阿里 、 腾 讯 ， 众 多 的 知名 公司 都 在 应 用 着 Python 。 

在 TIOBE 的 榜 单 上 , Python 也 是 前 三 甲 的 常客 。 越 来 越 多 的 程序 员 , 转 而 成 为 Python 的 信徒 ， 
这 是 一 门 魅力 四 射 的 编程 语言 。 

Python 是 一 种 解释 型 、 面 向 对 象 、 动 态 数据 类 型 的 高 级 程序 设计 语言 ， 近 两 年 Python 程序 员 
的 用 人 需求 猛 增 ， 兄 弟 连 2017 年 也 发 布 了 Python 课程 ， 希 望 通过 我 们 的 努力 ， 为 Python 技术 的 
推广 做 一 点 事情 。 您 正在 阅读 的 这 本 教材 ， 就 是 我 们 的 “科普 ”计划 之 一 ， 还 有 配套 学 习 的 视频 教 
程 。 

Python 社区 有 一 句 名言: “Life is short, You need Python.” 

翻译 过 来 就 是 人生 苦 短 ， 快 用 Python! 记得 多 年 前 ， 我 在 会 场 第 一 次 看 到 一 位 程序 员 ， 穿 
着 如 此 有 范 的 文化 衫 ， 就 对 这 门 语言 充满 了 好 奇 ， 而 且 ， 它 从 未 让 我 失望 。 

Enjoy Python, This book is for you! 

2006 年 ， 我 筹划 创办 了 兄弟 连 教育 。 在 过 去 的 十 余年 里 ， 兄 弟 连 培养 了 几 万 名 IT 程序 员 , 我 
们 的 培训 课程 、 大 学 讲座 、 出 版 图 书 、 视 频 教 程 等 ， 业 内 无 人 不 知 ， 无 人 不 晓 ， 兄 弟 连 也 一 直 是 
PHP 培训 领域 的 领头 羊 。 时 至 今日 , 我 们 已 经 在 全 国 各 地 设立 多 所 分 校 , 开设 了 Python+ 人 工 智能 、 
Java+ 大 数据 、Go+ 区 块 链 、Linux 云 计算 、PHP、UIUE、HTMLS5 等 众多 课程 。 





兄弟 连 教 育 创办 人 : 李 超 
2018 年 9 月 


了 路 
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什么 是 Python， 为 什么 要 使 用 它 ? Python 是 一 种 解释 型 的 、 面 向 对 象 的 、 带 有 动态 语义 的 高 
级 程序 设计 语言 。 这 里 有 很 多 术语 ， 你 可 以 在 阅读 本 书 的 过 程 中 逐渐 弄 懂 。 

Python 是 一 种 使 你 在 编程 时 能 够 保持 自己 风格 的 程序 设计 语言 ，Python 可 以 使 用 清晰 易 懂 的 
程序 来 实现 想 要 的 功能 。 如 果 你 之 前 没有 任何 编程 经 历 ， 那 么 既 简 单 又 强大 的 Python 就 是 你 入 门 
的 完美 选择 。 

伴随 着 国家 对 人 工 智 能 发 展 的 全 面 支持 与 鼓励 、 国 际 上 对 人 工 智能 的 重视 以 及 国家 教育 部 将 
Python 加 入 高 考 科目 ， 使 得 Python 在 中 国 的 使 用 范围 迅速 扩大 ; 另外 ， 随 着 区 块 链 、 人 工 智能 、 
大 数据 、 云 计算 等 技术 的 迅速 崛起 ， 市 场 对 Python 人 才 的 需求 让 长 期 沉默 的 Python 语言 一 下 子 备 
受众 人 的 关注 ， 本 书 可 以 说 是 应 运 而 生 。 本 书 是 以 Python 3.7 版 本 编写 而 成 的 ， 对 于 想 学 习 和 了 解 
Python 3.7 的 读者 ， 推 荐 阅读 本 书 。 


本 书 的 特色 


本 书 专门 针对 Python 新 手 量 身 定做 ,是 编者 学 习 和 使 用 Python 开发 过 程 中 的 体会 和 经 验 总 结 ， 
涵盖 实际 开发 中 重要 的 知识 点 ， 内 容 详 尽 ， 代 码 可 读 性 及 可 操作 性 强 。 

本 书 主要 介绍 Python 语言 的 类 型 和 对 象 、 操 作 符 和 表达 式 、 编 程 结构 和 控制 流 、 函 数 、 序 列 、 
多 线程 、 正 则 表达 式 、 面 向 对 象 编程 、 文 件 操作 、 网 络 编程 、 邮 件 收发 、 数 据 库 操作 等 ， 并 安排 了 
Python 的 虫 、 自 然 语言 处 理 和 区 块 链 项 目 范例 ， 各 章 还 安排 了 调试 、 问 题解 答 、 温 故 知 新 、 牛 刀 
小 试 等 内 容 ， 以 帮助 读者 学 会 处 理 程序 异常 ， 解 决 学 习 中 的 困惑 ， 巩 固 知识 、 学 以 致 用 。 

本 书 的 另 一 个 特色 是 ， 使 用 通俗 易 懂 的 描述 和 丰富 的 示例 代码 ， 并 结合 日 常生 活 中 的 一 些小 
事件 ， 使 本 书 读 起 来 生动 有 趣 ， 把 复杂 的 问题 以 简单 的 形式 展现 出 来 ， 使 读者 学 起 来 很 轻松 ， 充 分 
感受 到 学 习 Python 编程 的 乐趣 和 魅力 。 


本 书 的 内 容 


本 书 共 分 20 章 ， 各 章 内 容 安 排 如 下 : 

第 1 章 主 要 介绍 Python 的 起 源 、 应 用 场合 、 前 景 以 及 Python 3 的 一 些 新 特性 。 

第 2 章 主 要 介绍 Python 的 基础 知识 ， 为 后 续 学 习 相关 内 容 做 铺垫 。 

第 3 章 重点 介绍 列表 和 元 组 。 

第 4 章 重 点 介绍 字符 串 的 格式 化 、 分 割 、 搜 索 等 方法 。 

第 5 章 介 绍 字 典 ， 字 典 是 一 种 通过 名 字 引 用 值 的 数据 结构 。 

第 6 章 从 import 语句 开始 ， 逐 步 深入 介绍 条 件 语句 、 循 环 语句 以 及 列表 等 一 些 更 深层 次 的 语句 。 





IV 


Python 3.7 从 零 开 始 学 


第 7 章 主要 介绍 函数 ， 函 数 是 组 织 好 的 、 可 重复 使 用 的 、 用 来 实现 单一 或 相关 联 功能 的 代码 段 。 
第 8 章 主 要 介绍 Python 面向 对 象 编程 的 特性 ，Python 从 设计 之 初 就 是 一 门面 向 对 象 语言 ， 它 











提供 一 些 语言 特性 支持 面向 对 象 编程 。 


第 9 章 将 带领 读者 学 习 如 何 处 理 各 种 异常 ， 以 及 创建 和 自 定义 异常 。 

第 10 章 将 具体 讲解 Python 中 日 期 和 时 间 的 使 用 。 

第 11 章 主要 介绍 正则 表达 式 的 基本 使 用 。 

第 12 章 主要 介绍 如 何 使 用 Python 在 硬盘 上 创建 、 读 取 和 保存 文件 。 

第 13 章 主要 介绍 Python 中 的 多 线程 编程 。 

第 14 章 主要 介绍 如 何 使 用 Python 语言 发 送 和 接收 邮件 。 

第 15 章 重点 介绍 Python 在 网 络 编程 方面 的 特性 。 

第 16 章 重点 介绍 Python 的 图 形 化 编程 一 一 GUI 编程 。 

第 17 章 重点 介绍 在 Python 3 中 使 用 PyMySQL 连接 数据 库 ， 并 实现 简单 的 增 、 删 、 改 、 查 。 
第 18 章 根据 前 面 所 学 的 内 容 讲 解 一 个 爬虫 的 实战 项 目 。 

第 19 章 结合 息 虫 、 分 词 、 词 频 统计 等 知识 点 实现 自然 语言 的 分 词 和 词 频 统计 。 
第 20 章 以 当下 很 火 的 区 块 链 做 一 个 完整 的 Python 实现 。 


读者 对 象 


@ “Python 3.x 初学 者 。 
e@ 想 学 习 和 了 解 Python 3.x 的 程序 员 。 
@ Python 3.x 网 课 、 培 训 机 构 、 中 学 及 大 专 院 校 的 学 生 。 


关于 本 书 


本 书 是 在 《Python 3.5 从 零 开 始 学 》 的 基础 上 改版 而 成 的 。《Python 3.5 从 零 开始 学 》 的 出 版 


受到 很 多 读者 的 欢迎 ， 半 年 之 内 ， 连 续 7 次 印刷 ， 期 间 读者 通过 QQ、 邮 件 等 方式 提出 了 很 多 的 修 


本 
并 





正 与 改进 意见 ， 并 希望 可 以 有 更 多 知识 点 的 覆盖 ， 如 添加 GUI 编程 方面 的 内 容 、 有 更 多 的 示例 等 。 
本 书 基于 Python 3.7 版 本 编写 而 成 , 结合 读者 朋友 们 的 要 求 , 每 章 都 增加 了 一 个 综合 性 实战 小 示例 ， 
且 每 章 的 习题 量 也 增加 了 。 本 书 还 增加 了 GUI 编程 ， 并 且 结合 当前 市 场 需求 ， 将 之 前 的 数据 分 





析 实 战 更 改 为 自然 语言 分 词 与 词 频 统计 实战 ， 最 后 增加 了 区 块 链 的 项 目 实战 。 


致谢 


本 书 在 写作 过 程 中 遇 到 了 很 多 困难 以 及 写作 方式 上 的 困惑 ， 好 在 如 今 是 信息 互联 的 时 代 ， 让 


笔者 有 机 会 参阅 很 多 相关 信息 , 也 让 很 多 困难 得 以 较 好 地 解决 。 本 书 在 写作 过 程 中 参考 了 一 些 相关 
资料 ， 主 要 包括 《Python 基础 教程 〈 第 2 版 ) 》《 笨 办 法 学 Python 〈 第 4 版 ) 》《 像 计算 机 科学 
家 一 样 思考 Python》、 雇 雪 峰 的 博客 以 及 W3C 等 。 在 此 ， 对 这 些 资料 的 编者 表示 真诚 的 感谢 。 


在 本 书 交 稿 之 际 ， 感 谢 清华 大 学 出 版 社 的 王 金 柱 编辑 ， 在 本 书 编写 的 过 程 中 ， 王 编辑 给 予 了 


前 言 | V 





很 多 指导 和 修改 意见 。 同 时 感谢 刘 艳 老师 对 其 中 一 些 章节 录制 了 视频 , 供 大 家 更 方便 地 学 习 本 书 内 
容 , 也 感谢 刘 艳 老师 能 参与 本 书 部 分 章节 的 编写 和 修改 。 最 后 , 感谢 家 人 和 朋友 在 写作 期 间 给 予 的 
安静 写作 环境 ， 让 笔者 不 被 更 多 琐事 打扰 ， 从 而 专心 于 写作 。 感 谢 你们 ， 没 有 你 们 的 帮助 与 关心 ， 
本 书 不 能 如 期 完成 。 

最 后 感谢 读者 们 的 鼓励 和 支持 ， 正 因为 有 你 们 不 断 指出 不 足 、 不 断 提 出 问题 与 意见 ， 才 使 本 
书 更 珠 完 美 。 


客户 支持 


你 现在 已 经 是 《Python 3.7 从 零 开 始 学 》 一 书 的 读者 了 , 为 了 让 你 能 获取 更 多 、 更 便捷 的 资源 ， 
笔者 还 为 你 准备 了 以 下 内 容 。 

随 书 源码 地 址 : https://github.com/liuyuzhou/python3.7sourcecode.git 

技术 群 及 问题 解答 方式 

Python 技术 服务 QQ 群 : 634027520 

CSDN 技术 博客 : youzhouliu 

技术 问答 Email: jxgzyuzhouliu@163.com 


刘 宇 宙 
2018 年 9 月 
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该 小 程序 课件 提供 了 丰富 的 学 习 次 源 ， 大 幅 拓 展 了 本 书 内 容 。 
配套 小 程序 课程 提供 了 八大 主题 ， 读 者 在 注册 小 程序 后 即 可 使 用 。 
扫描 右 侧 的 二 维 码 ， 注 册 后 即 可 进入 小 程序 主 界面 。 


本 书 配套 小 程序 课件 





器 四 
视频 代码 示例 
民 四 
习题 资源 包 
四 

扩展 知识 演示 文档 
©@ 

常见 问题 作业 
小 程序 课件 主 界面 


视频 : 包括 但 不 限于 本 书 内 容 的 视频 教学 ， 播 放 时 长 超过 40 小 时 ， 视 频 教学 对 本 书 内 容 
进行 了 大 幅 拓 展 。 


日 ”代码 示例 : 包括 本 书 各 章 所 有 代码 示例 ， 直 接 复制 即 可 使 用 ， 无 须 再 费时 费力 地 用 键盘 录入 。 


题 : 除 本 书 各 章 提供 的 练习 题 外 ， 小 程序 还 专门 设计 了 400 多 个 练习 题 ， 供 读者 巩固 知 
识 ， 提 升 开发 技能 。 
资源 包 : 提供 了 高 效 学 习 本 书 内 容 的 20 多 种 常用 资源 包 
扩展 知识 : 提供 了 与 本 书 内 容 相关 的 60 多 条 拓展 知识 。 
演示 文档 : 提供 了 本 书 内 容 的 20 多 个 PPT 教学 课件 。 
常见 问题 : 提供 了 80 多 个 常见 问题 及 解答 ， 如 果 读 者 在 学 习 过 程 中 遇 到 困惑 ， 可 到 本 主 
题 寻 求 答案 。 
作业 : 提供 了 40 多 个 课外 作业 ， 读 者 可 以 到 本 栏目 尝试 自己 检查 学 习 效 果 是 否 达到 了 预 
期 目标 。 


本 小 程序 课件 完全 免费 ， 此 外 ， 本 小 程序 的 课件 内 容 会 不 断 更 新 和 扩充 ， 冤 请 读者 关注 。 
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第 1 齐 
进入 Python 3.7 的 精彩 世界 


本 章 主要 介绍 Python 的 起 源 、 应 用 场合 .前景 以 及 Python 3 相对 于 Python 2 的 一 些 新 特性 。 另外 ， 
还 将 介绍 Python 的 环境 构建 ， 然 后 以 一 个 简单 的 小 程序 Hello World 开启 Python 的 编程 之 旅 。 


1.1 ”Python 的 起 源 


Python 的 创始 人 为 Guido van Rossum (后 文 简称 Guido) 。1982 年 ，Guido 从 阿姆斯特丹 大 学 
获得 数学 和 计算 机 硕士 学 位 。 尽 管 Guido 算得 上 是 一 位 数学 家 ， 不 过 他 更 享受 计算 机 带 来 的 乐趣 。 
用 Guido 的 话说 , 尽管 他 拥有 数学 和 计算 机 双料 资质 ， 不 过 他 更 倾向 于 做 计算 机 相关 的 工作 ,并 热 
囊 于 做 所 有 和 编程 相关 的 活 儿 。 

Guido 接触 并 使 用 过 Pascal、C、Fortran 等 语言 ， 这 些 语言 的 基本 设计 原则 是 让 机 器 运行 得 更 
快 。 在 20 世纪 80 年 代 ， 虽然 IBM 和 苹果 已 经 掀起 了 个 人 计算 机 浪潮 ， 但 是 那 时 候 个 人 计算 机 的 
配置 很 低 ， 比 如 早期 的 Macintosh 只 有 8MHz 的 CPU 主 频 和 128KB 的 RAM， 一 个 大 的 数组 就 能 
占 满 内 存 ， 因 此 所 有 编译 器 的 核心 都 是 做 优化 ， 以 便 让 程序 能 够 运行 。 为 了 提高 效率 ， 程 序 员 不 得 
不 像 计算 机 一 样 思考 ， 以 便 写 出 更 符合 机 器 口味 的 程序 ， 在 那个 时 代 , 程序 员 恨 不 得 榨取 计算 机 每 
一 寸 的 能 力 ， 有 人 甚至 认为 C 语言 的 指针 是 在 浪费 内 存 。 至 于 动态 类 型 、 内 存 自动 管理 、 面 向 对 
象 等 就 不 要 想 了 ， 这 些 只 会 让 你 的 计算 机 陷入 瘫痪 。 

这 种 编程 方式 让 Guido 感到 苦恼 。 虽然 Guido 知道 如 何 用 C 语言 写 出 一 个 功能 ， 但 整个 编写 
过 程 却 需要 耗费 大 量 时 间 。Guido 还 可 以 选择 Shell，Boume Shell 作为 UNIX 系统 的 解释 器 已 经 存 
在 很 入 了 。UNIX 的 管理 员 常常 用 Shell 写 一 些 简单 的 脚本 ， 以 进行 系统 维护 的 工作 ， 比 如 定期 备 
份 、 文 件 系统 管理 等 。 在 C 语言 中 , 许多 上 百 行 的 程序 在 Shell 中 只 用 几 行 就 可 以 完成 。 然 而, Shell 
的 本 质 是 调用 命令 ， 它 不 是 一 个 真正 的 语言 ， 比 如 Shell 没有 数值 型 的 数据 类 型 ， 运 用 加 法 运算 都 
很 复杂 。 总 之 ，Shell 不 能 全 面 调动 计算 机 的 功能 。 
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Guido 希望 有 一 种 语言 能 够 像 C 语言 一 样 全 面 调用 计算 机 的 功能 接口 ， 又 可 以 像 Shell 一 样 轻 
松 编程 。ABC 语言 让 Guido 看 到 了 和 希望， 该 语言 是 由 荷兰 的 数学 和 计算 机 研究 所 开发 的 ，Guido 
曾经 在 该 研究 所 工作 ， 并 参与 了 ABC 语言 的 开发 。 与 当时 大 部 分 语言 不 同 的 是 ，ABC 语言 以 教学 
为 目的 ， 目 标 是 “让 用 户 感觉 更 好 ”， 和 希望 通过 ABC 语言 让 语言 变 得 容易 阅读 、 容 易 使 用 、 容 易 
记忆 、 容 易学 习 ， 并 以 此 激发 人 们 学 习 编 程 的 兴趣 。 

ABC 语言 尽管 已 经 具备 了 良好 的 可 读 性 和 易 用 性 ， 不 过 始终 没有 流行 起 来 。 当 时 ，ABC 语言 
编译 器 需要 配置 比较 高 的 计算 机 才能 运行 , 而 这 些 计 算 机 的 使 用 者 通常 精通 计算 机 , 他 们 考虑 更 多 
的 是 程序 的 效率 ， 而 不 是 学 习 难 度 。ABC 语言 不 能 直接 操作 文件 系统 ， 尽 管用 户 可 以 通过 文本 流 
等 方式 导入 数据 ， 不 过 ABC 无 法 直接 读 写 文件 。 输 入 输出 的 困难 对 于 计算 机 语言 来 说 是 致命 的 。 
你 能 想象 一 款 打 不 开车 门 的 跑车 吗 ? 

1989 年 ， 为 了 打发 圣诞 节 假 期 ，Guido 开始 写 Python 语言 的 编译 器 。Python 这 个 名 字 来 自 于 
Guido 所 执 爱 的 电视 剧 一 一 Monty Python's Flying Circus， 他 希望 这 个 新 语言 Python 能 够 符合 他 的 
理想 : 创造 一 种 介 于 C 和 Shell 之 间 ， 功 能 全 面 、 易 学 易 用 、 可 拓展 的 语言 。Guido 作为 一 个 语言 
设计 爱好 者 ， 已 经 尝试 过 设计 语言 ， 这 次 不 过 是 一 种 纯粹 的 hacking 行为 。 

1991 年 ， 第 一 个 Python 编译 器 诞生 。 该 编译 器 是 用 C 语言 实现 的 ， 并 且 能 够 调用 C 语言 
库 文件 。Python 诞生 时 便 具 有 类 、 函 数 、 异 常 处 理 、 包 含 表 和 词典 在 内 的 核心 数据 类 型 以 及 模块 
为 基础 的 拓展 系统 。 

Python 的 很 多 语法 来 自 于 C， 却 又 受 ABC 语言 的 强烈 影响 。 来 自 ABC 语言 的 一 些 规定 至 今 
还 富有 和 争议 (比如 强制 缩 进 ) ， 不 过 这 些 语法 规定 让 Python 容易 理解 。 另 一 方面 ，Guido 聪明 地 
选择 让 Python 服从 一 些 惯例 ， 特 别 是 C 语言 的 惯例 ， 比 如 回归 等 号 赋值 。Guido 认为 “常识 ” 确 
定 的 东西 没有 必要 过 度 纠 结 。 

Python 从 一 开始 就 特别 在 意 可 拓展 性 .Python 可 以 在 多 个 层次 上 拓展 , 在 高 层 可 以 直接 引入 .py 
文件 ， 在 底层 可 以 引用 C 语言 的 库 。 程 序 员 可 以 使 用 Python 快速 编写 .py 文件 作为 拓展 模块 。 当 
性 能 是 重点 考虑 的 因素 时 ， 程 序 员 可 以 深入 底层 写 C 程序 ， 将 编译 的 .so 文件 引入 Python 中 使 用 。 
Python 就 像 使 用 钢筋 建 房 一 样 ， 要 先 规定 好 大 的 框架 ， 程 序 员 可 以 在 此 框架 下 相当 自由 地 拓展 或 
更 改 。 

最 初 ，Python 完全 由 Guido 本 人 开发 ， 后 来 逐渐 受到 Guido 同事 的 欢迎 ， 他 们 迅速 反馈 使 用 
意见 ， 并 参与 Python 的 改进 。Guido 和 一 些 同事 构成 了 Python 的 核心 团队 ， 他 们 将 自己 大 部 分 业 
余 时 间 用 于 hack Python，Python 逐渐 拓展 到 了 研究 所 外 。Python 将 许多 机 器 层面 的 细节 隐藏 交 给 
编译 器 处 理 ， 并 凸显 逻辑 层面 的 编程 思考 ， 程 序 员 使 用 Python 时 可 以 将 更 多 时 间 用 于 程序 逻辑 的 
思考 ， 而 不 是 具体 细节 的 实现 ， 这 一 特征 吸引 了 广大 程序 员 。Python 开始 流行 起 来 了 。 





1.2 ”Python 的 应 用 场合 


现在 ， 全 世界 有 600 多 种 编程 语言 ， 但 流行 的 编程 语言 也 就 20 多 种 。 如 果 你 听 说 过 TIOBE 
排行 榜 ， 就 能 知道 编程 语言 的 大 致 流行 程度 。 图 1-1 是 2002 一 2018 年 常用 的 10 种 编程 语言 的 变化 
图 。 
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TIOBE Programming Community Index 














图 1-1 TIOBE 排行 榜 


2015 年 和 2016 年 ，Python 基本 处 于 第 5 位 ， 市 场 占有 率 次 于 Java、C、C++ 和 C#， 从 2017 
年 开始 ，Python 借 着 人 工 智能 的 东风 ， 热 度 一 路 水 涨 船 高 ， 目 前 已 经 排 到 第 4 位 ， 有 些 排名 机 构 
甚至 将 其 排 为 第 1 位 。Python 是 一 门 比较 注重 效率 的 语言 ， 不 复杂 ， 读 和 写 都 非常 方便 ， 所 以 才 
有 “人 生 苦 短 ， 我 用 Python” 这 样 的 调侃 。 云 计算 和 大 数据 方面 对 Python 人 才 的 需求 也 在 持续 增 
加 。 当 前 比较 火热 的 区 块 链 就 大 量 使 用 Python 做 具体 实现 。 

Python 在 云 计 算 方 面 的 用 途 很 大 ， 比 如 云 计 算 中 IaaS (Infrastructure as a Service， 基 础 设施 即 
服务 ) 层 的 很 多 软件 都 大 量 使 用 Python， 云 计算 的 其 他 服务 都 建立 在 IaaS 服务 的 基础 上 。 

下 面 这 些 使 用 比较 广泛 的 软件 就 大 量 使 用 Python。 


(1) Google 深度 学 习 框架 TensorFlow 全 由 Python 实现 。 
(2) 深度 学 习 框架 Caffe 由 Python 实现 。 

(3) 开源 IaaS 软件 (ZStack) 。 

(4) 开源 云 计 算 技 术 (OpenStack) 。 

(5) Amazon s3 命令 行 管理 工具 (s3cmd) 。 

(6) EC2 云 计算 管理 工具 (StarCluster) 。 


在 大 数据 领域 ，Python 的 使 用 也 越 来 越 广 泛 。Python 在 数据 处 理 方面 有 如 下 优势 : 


(1) 异常 快捷 的 开发 速度 ， 代 码 非常 少 。 

(2) 丰富 的 数据 处 理 包 ， 无 论 是 正则 ， 还 是 HTML 解析 、XML 解析 ， 用 起 来 都 非常 方便 。 

(3) 内 部 类 型 使 用 成 本 很 低 ， 不 需要 许多 额外 操作 (Java、C++ 用 一 个 Map 都 很 费劲 ) 。 

(4) 公司 中 大 量 数 据 处 理工 作 不 需要 面 对 非常 大 的 数据 。 

(5) 巨大 的 数据 不 是 语言 所 能 解决 的 ， 需 要 处 理 数据 的 框架 (如 Hadoop) 。Python 虽然 小 
众 ， 但 是 有 处 理 大 数据 的 框架 。 一 些 框架 也 支持 Python。 

(6) 编码 问题 处 理 起 来 非常 方便 。 


除了 在 人 工 智 能 、 区 块 链 、 云 计算 和 大 数据 领域 的 应 用 外 ， 很 多 网 站 也 是 用 Python 开发 的 ， 
很 多 大 公司 (如 Google、Yahoo 以 及 NASA) 都 大 量 使 用 Python。 

我 们 熟知 的 AlphaGo 就 是 Google 用 TensorFlow 实现 的 ，Facebook 也 是 扎 克 伯 格 用 Python 开 
发 出 来 的 ， 后 来 的 Twitter 也 是 用 Python 写 的 ， 实 际 上 Python 是 国外 很 多 大 公司 (如 Google) 使 
用 的 主要 语言 。 
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“ 龟 权 ”给 Python 的 定位 如 图 1-2 所 示 ， 为 “优雅 ” 
“明确 ”“ 简 单 ”。Python 程序 看 上 去 总 是 简单 易 懂 ， 初 
学 者 学 Python 不 但 容易 入 门 ,而且 将 来 深入 下 去 可 以 编写 
非常 复杂 的 程序 。 A 

Python 的 哲学 就 是 简单 、 优 雅 、 明 确 ， 尽 量 写 容易 看 简单 
明白 的 代码 ， 尽 量 将 代码 写 得 更 少 。 

Python 是 一 个 简单 、 解 释 型 、 交 互 式 、 可 移植 、 面 向 
对 象 的 超 高 级 语言 。 这 是 对 Python 语言 的 简单 描述 。 明 确 

Python 有 一 个 交互 式 的 开发 环境 ，Python 的 解释 运行 
大 大 节省 了 每 次 编译 的 时 间 。Python 语法 简单 ， 内 置 几 种 
高 级 数据 结构 〈 如 字典 、 列 表 等 ) ， 使 用 起 来 特别 简单 。 
Python 具有 大 部 分 面向 对 象 语言 的 特征 ， 可 完全 进行 面向 
对 象 编 程 。Python 可 以 在 MS-DOS、Windows、Windows NT、 Linux、Solaris、Amiga、BeOS、OS/2、 
VMS、QNX 等 多 种 操作 系统 上 运行 。 








图 1-2 Python 的 定位 


1.3 从 2.7 到 3.7，Python 的 新 特性 


目前 ，Python 有 两 个 版 本 ， 一 个 是 2.x 版 ， 另 一 个 是 3.x 版 ， 这 两 个 版 本 是 不 兼容 的 。3.x 版 
不 考虑 对 2.x 版 代码 的 向 后 兼容 ， 当 前 来 看 ，3.x 版 会 越 来 越 普及 。 在 写本 书 时 ，Python 的 最 新 版 
本 是 3.7.0, 本 书 中 的 示例 和 讲解 的 内 容 都 是 基于 这 个 版 本 进行 的 。 建 议 读者 安装 3.6.2 以 上 的 版 本 ， 
这 样 学 习 本 教程 中 的 内 容 才 会 更 加 容易 。 

在 3.x 中 ,一 些 语法 内 建 函 数 和 对 象 的 行为 有 所 调整 .大 部 分 Python 库 都 同时 支持 Python 2.7.x 
和 3.x 版 本 ， 所 以 无 论 选 择 哪个 版 本 都 可 以 。 为 了 在 使 用 Python 时 避免 某 些 版 本 中 常见 的 陷阱 ， 
或 者 需要 移植 某 个 Python 项 目 时 ， 依 然 有 必要 了 解 一 下 Python 两 个 常见 版 本 之 间 的 主要 区 别 。 

2.x 和 3.x 版 本 之 间 的 主要 区 别 如 下 : 

1. 使 用 _future _ 模块 

Python 3.x 引入 了 一 些 与 Python 2.x 不 兼容 的 关键 字 和 特性 。 在 Python 2.x 中 ， 可 以 通过 内 置 
的 _future_ 模块 导入 这 些 新 内 容 。 如 果 你 希望 在 Python 2.x 环境 下 写 的 代码 也 可 以 在 Python 3.x 
中 运行 ， 那 么 建议 使 用 _ future_ 模块 。 

2. print 函数 

虽然 print 语法 是 Python 3 中 一 个 很 小 的 改动 , 而 且 应 该 已 经 广为人知 , 但 是 依然 值得 提 一 下 : 
Python 2 中 的 print 语句 被 Python 3 中 的 print0 函 数 取 代 ， 这 意味 着 在 Python 3 中 必须 用 括号 将 需 
要 输出 的 对 象 括 起 来 。 在 Python 2 中 使 用 额外 的 括号 也 可 以 , 但 是 如 果 要 在 Python 3 中 以 Python 2 
的 形式 不 带 括号 调用 print 函数 ， 就 会 触发 SyntaxError 〈 语 法 错误 ) 。 
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3. 整数 除法 

由 于 人 们 常常 会 忽视 Python 3 在 整数 除法 上 的 改动 〈 写 错 了 也 不 会 触发 SyntaxError) ， 因 此 
在 移植 代码 或 在 Python 2 中 执行 Python 3 的 代码 时 需要 特别 注意 这 个 改动 。 

4. Unicode 


Python 2 有 基于 ASCII 的 str() 类 型 ,可 通过 单独 的 unicode() 函 数 转 成 unicode 类 型 ,但 没有 byte 
类 型 。 在 Python 3 中 有 了 Unicode (UTF-8) 字符 串 和 两 个 字 节 类 (bytes 和 bytearrays) 。 

5. xrange 

在 Python 2.x 中 ， 经 常会 用 xrange0 创 建 一 个 可 迭代 对 象 ， 通 常 出 现在 “for 循环 ”或 “列表 / 
集合 /字典 推导 式 ” 中 。 在 Python 3 中 ，range() 的 实现 方式 与 xrange() 函 数 相 同 ， 所 以 不 存在 专用 的 
xrange()〔 在 Python 3 中 使 用 xrange() 会 触发 NameError) 。 


6. 触发 异常 

Python 2 支持 新 旧 两 种 异常 触发 语法 ， 而 Python 3 只 支持 带 插 号 的 语法 不然 会 触发 
SyntaxError) 。 

7. 处 理 异 常 

Python 3 中 的 异常 处 理发 生 了 一 点 变化 。 在 Python 3 中 必须 使 用 as 关键 字 ，Python 2 中 不 需 

8. next() 函 数 和 .next() 方 法 


由 于 会 经 常用 到 next() 函 数 〈.next() 方 法 ) ， 因 此 要 提 到 另 一 个 语法 改动 (实现 方面 也 做 了 改 
动 ) : 在 Python 2 中， 函数 形式 和 方法 形式 都 可 以 使 用 ; 在 Python 3 中 ， 只 能 使 用 next0 函 数 试 
图 调用 .next0 方 法 会 触发 AttributeError) 。 
9. for 循环 变量 与 全 局 命名 空间 泄漏 
在 Python 3.x 中 ，for 循环 中 的 变量 不 再 会 泄漏 到 全 局 命名 空间 中 了 。 
10. 比较 无 序 类 型 
Python 3 中 另 一 个 优秀 的 改动 是 ， 如 果 我 们 试图 比较 无 序 类 型 ， 就 会 触发 一 个 TypeError。 
11. 使 用 input() 解 析 输 入 内 容 
Python 3 改进 了 inputO) 函 数 ， 这 样 该 函数 就 会 总 是 将 用 户 的 输入 存储 为 str 对 象 。 在 Python 2 
为 了 避免 读 取 非 字符 串 类 型 会 发 生 的 一 些 危 险 行为 ， 不 得 不 使 用 raw_input0 代 蔡 input()。 
12. 返回 可 迭代 对 象 ， 而 不 是 列表 
某 些 函数 和 方法 在 Python 3 中 返回 的 是 可 迭代 对 象 ， 而 不 像 在 Python 2 中 返回 列表 。 对 象 只 
遍历 一 次 会 节省 很 多 内 存 ， 如 果 通 过 生成 器 多 次 迭代 这 些 对 象 ， 效 率 就 不 高 了 。 此 时 如 果 需 要 列表 
对 象 ， 可 以 通过 Python 3 的 list() 函 数 简单 地 将 可 迁 代 对 象 转 成 列表 。 

Python 3.7 相对 于 Python 3.5， 有 如 下 新 特性 : 

(1) 重新 实现 了 字典 dict) 类型， 以便 能 像 PyPy 的 字典 类 型 一 样 使 用 更 紧凑 的 表达 方式 。 
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与 Python 3.5 相 比 ， 这 使 字典 的 内 存 用 量 减 少 了 20%~25%。 该 特性 在 3.6 版 本 实现 。 

(2) 为 asyncio 模块 增加 了 新 功能 , 如 显著 的 可 用 性 、 性 能 优化 以 及 大 量 的 错误 修复 。 从 Python 
3.6 开始 ，asyncio 模块 不 再 是 临时 的 ， 其 API 也 进入 了 稳定 状态 。 

(3) 引入 了 一 种 新 的 字符 串 : _f-strings_， 或 者 格式 化 字符 串 。 格 式 化 字符 串 带 f 前 级 ， 类 似 
于 strformat0) 接 受 的 格式 化 字符 串 。 它 们 包含 由 花 括号 括 起 来 的 替换 字段 ， 蔡 换 字段 是 表达 式 ， 它 
们 会 在 运行 时 计算 ， 然 后 使 用 format() 协 议 进 行 格式 化 。 

(4) 在 Python 3.6 版 本 后 ， 可 在 同一 个 函数 体 中 使 用 await 和 yield。 

(5) 添加 了 对 async for 在 list、set、dict 解析 式 以 及 generator 表达 式 中 的 使 用 支持 。 

(6) 支持 nanosecond 的 时 间 函 数 ， 方 便 对 nanosecond 的 操作 ， 提 供 了 6 个 新 增 的 函数 ， 分 
别 为 : clock_gettime_ns()、clock_settime_ns()、monotonic_ns()、perf counter_ns()、process_time_ns() 
和 time_ns()。 

(7) 在 新 版 本 中 添加 了 @dataclass 装饰 器 , 利用 该 装饰 器 可 以 减少 数据 类 型 定义 的 代码 行 数 。 





1.4 如 何 学 习 Python 


学 习 Python 时 ， 建 议 找 一 些 搭档 一 起 学 习 和 讨论 ， 这 样 效果 会 更 好 。 若 能 尝试 将 一 些 内 容 讲 
给 他 人 听 ， 则 效果 更 佳 ， 在 讲述 的 过 程 中 你 会 思考 更 多 。 在 学 习 的 过 程 中 ， 对 于 遇 到 的 例子 最 好 能 
逐步 形成 自己 先 思考 的 习惯 , 思考 后 再 看 看 给 出 的 示例 是 怎样 的 , 在 这 个 过 程 中 或 许 能 找到 比 示 例 
更 好 的 处 理 方法 。 此 外 ， 练 习题 最 好 也 能 动手 完成 。 

在 写 代码 时 ， 千 万 不 要 用 “复制 ”“ 粘 贴 ”把 代码 从 页 面 粘贴 到 你 的 计算 机 上 。 写 程序 讲究 
感觉 ， 需 要 一 个 字母 一 个 字母 地 把 代码 敲 进 去 。 在 敲 代码 的 过 程 中 ,初学 者 经 常会 敲 错 ， 所 以 需要 
仔细 检查 、 对 照 ， 这 样 才能 以 最 快 的 速度 掌握 如 何 写 程序 。 在 编写 代码 的 过 程 中 ， 宁愿 写 得 慢 或 多 
写 几 遍 ， 刚 开始 学 习 或 许 很 吃力 ， 但 随 着 慢 慢 积累 和 熟悉 ， 后 面 会 越 来 越 快 ， 越 来 越 顺畅 。 若 习惯 
复制 代码 ， 或 许 很 长 一 段 时 间 后 依然 只 会 复制 代码 ， 而 不 能 熟悉 相关 内 容 ， 速 度 也 提升 不 了 。 

语言 的 发 展 总 是 不 断 变化 的 ， 任 何 一 门 语言 要 让 大 家 持续 不 断 的 使 用 ， 都 需要 不 断 更 新 。 语 
言 本 身 需 要 不 断 更 新 ,学 习 者 也 要 不 断 学 习 语 言 本 身 的 新 东西 ， 这 样 才能 与 时 候 进 ， 跟 上 语言 的 发 
展 。 

Python 作为 一 门 不 断 发 展 与 普及 的 语言 ， 还 在 不 断 更 新 中 。 如 果 要 了 解 有 关 最 新 发 布 的 版 本 
和 相关 工具 的 内 容 ，http:/www.python.org 就 是 一 个 聚宝 贫 。 加 入 一 些 Python 学 习 社 区 或 找到 一 些 
有 共同 爱好 的 人 一 起 学 习 交 流 是 非常 好 的 学 习 Python 的 方式 。 正 所 谓 集思广益 ， 一 起 思考 与 学 习 
的 人 多 了 ,大 家 能 接触 和 学 到 的 知识 就 会 更 多 。 在 互联 网 时 代 ， 更 应 该 发 挥 网 络 互联 的 作用 ， 通 过 
网 络 学 习 更 新 颖 、 更 与 时 俱 进 的 知识 。 

以 下 网 址 可 以 帮助 读者 更 好 地 学 习 Python: 


(1) http://www.liaoxuefeng.com/ 
(2) http://www.runoob.com/python3/python3-tutorial.html 
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1.5 “Python 环境 构建 


工 欲 善 其 事 ， 必 先 利 其 器 。 在 开始 编程 前 ， 需 要 先 准备 好 相关 工具 。 下 面 简 要 介绍 如 何 下 载 
和 安装 Python 。 

Python 的 安装 软件 可 以 从 Python 官方 网 站 下 载 ， 地 址 为 : https://www.python.org/downloads/。 
建议 下 载 软件 时 从 对 应 的 官方 网 站 下 载 ， 这 样 比较 权威 ， 而 且 更 加 安全 。 


1.5.1 在 Windows 系统 中 安装 Python 


在 Windows 系统 中 安装 Python 可 以 参照 下 面 的 步骤 。 

人 ER) 打开 Web 浏览 器 (如 百度 、Google、 火 狐 等 浏览 器 )， 访 问 https://www.python.org/ 
downloads/， 进 入 网 页 ， 应 该 可 以 看 到 如 图 1-3 所 示 的 页 面 ， 单 击 图 中 箭头 和 下 画 线 标注 的 地 方 ， 
进入 对 应 软件 的 下 载 页 面 即 可 进行 软件 的 下 载 。 


EU 





1-3 Python 官方 网 站 下 载 页 面 


也 可 以 用 另 一 种 方式 下 载 软件 , 如 图 1-4 所 示 。 直 接 在 浏览 器 的 搜索 框 中 输入 Python 进行 搜索 ， 
可 找到 搜索 结果 ， 进 入 下 载 即 可 。 有 以 下 几 点 需要 注意 : 


( 1 ) 查看 对 应 版 本 。 图 1-4 中 Python 的 版 本 为 3.5.2。 

( 2 ) 查看 是 电脑 版 还 是 Mac 版 。 图 1-4 中 显示 的 是 电脑 版 的 Python 软件 信息 。 
( 3 ) 查看 版 本 号 。 如 果 要 用 最 新 版 Python ， 应 该 查找 的 版 本 是 3.7.0。 

(4 ) 支持 的 环境 。 图 1-4 中 的 环境 信息 显示 支持 Windows 系列 的 环境 。 





























,00 
Bai 合 百度 python 下 载 






6-07-26 
nXP/Win2003VistaWin7/Win8 一 
几 百度 下 载 冯 手 这 行 委 芭 志 二 下载 
a 者 示 下 过 








1-4 Python 下 载 页 面 
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下 载 软件 后 ， 接 下 来 进行 软件 的 安装 。 

( 1 ) 双击 下 载 好 的 软件 ， 或 者 选中 并 右 击 下 载 好 的 软件 ， 在 弹出 的 菜单 中 选择 “打开 ”选项 ， 
可 以 看 到 如 图 1-5 所 示 的 界面 。 底 部 的 第 一 个 复 选 框 默认 自动 勾 选 , 保持 勾 选 状态 即 可 , Add Python 
3.7 to PATH 复 选 框 默认 不 勾 选 ， 需要 手动 勾 选 , 可 以 将 Python 的 安装 路 径 添加 到 环境 变量 中 , 色 选 
后 , 后 面 可 省 去 该 操作 。 如 果 希 望 将 Python 安装 到 指定 路 径 下 , 就 单 击 Customize installation。 如 果 








的 目录 。 ) 


python 3.7.0 (64-bit) SetuBl 





ff 击 Install Now， 系 统 就 会 直接 开始 安装 Python, 并 安装 到 默认 路 径 下 。( 此 处 建议 安装 到 自己 指定 


[= 





python 
windows 





Install Python 3.7.0 (64-bit) 
Select Install Now to install Python with default settings or choose 
Customize to enable or disable features. 
二 Install Now 
Cau: INPrograms\Vython\Python37 


Includes IDLE, pip and documentation 
Creates shortcuts and file associations 


3 Customize installation 
Choose location and features 


Install launcher fo all users (recommended) 
AddPython37toPATH ee— 











(2 ) 单 击 Customize installation 


接 单 击 Next 按钮 





可 。 


Python 370 (64-bit) Setup 


2 


python 


for 








| windows Back 


图 1-5 安装 Python 
后 ， 会 看 到 如 图 1-6 所 示 的 界面 。 此 处 没什么 需要 注意 的 ， 直 





Optional Features 
团 Documentation 
Jnstalls the Python documentation file. 
gp 
Installs pip, which can download and install other Python packages. 
td/tk and IDLE 
jnstalls tkinter and the IDLE development environment. 
Python test suite 
Installs the standard library test suite, 
加 py launcher Ffor all users (requires elevation) 
jnstalls the global ‘py launcher to make it easier to start Python. 























图 1-6 单 击 Next 按钮 


(3 ) 在 图 1-7 所 示 的 界面 中 ， 第 一 个 箭头 指向 的 是 系统 默认 的 Python 安装 路 径 ， 若 需要 更 改 
默认 安装 路 径 ， 则 可 单 击 第 二 个 箭头 所 指 的 Browse 按钮 。 
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= wearocrtuscii ces 
Advanced Options 


DInstall for al users 

回 Assoaiate files with Python (requires the py launchen 
回 Create shortcuts for installed applications 

回 Add Python to environment variables 

口 precompile standard fibrary 

DDownload debugging symbols 


© Download debug binaries (requires VS 2015 or later) 


Customize install location 
CAUsers\yzAppData\Loca\Programs\Python\Python37 





























python 
windows Back instal 
图 1-7 更 改 安装 路 径 
( 4 ) 如 图 1-8 所 示 , 安装 路 径 没 有 使 用 默认 路 径 , 笔者 已 将 安装 路 径 修改 为 E\python\ python37。 
BS python 37.0 (64-bit) Setup [= lb 
Advanced Options 
Install for al users 
Associate files with Python (requires the py launchen 
辐 Create shortouts for installed applications 
Add Python to environment variables 
2 j 口 Brecompile standard fibrary 
[| Download debugging symbols 


[D Download debug binaries (requires VS 2015 or later) 
Customize install location 
ENpython\python37 Browse 
python 
a 你 
windows Beck Binstat | (Cancel 















































图 1-8 查看 已 更 改 的 安装 路 径 


( 5 ) 更 改 安装 路 径 后 ， 单 击 Install 按钮 ， 得 到 如 图 1-9 所 示 的 界面 ， 可 以 看 到 安装 正在 进行 中 。 
多 Python 3.7.0 (64-bit) Setup . [= leew 





Setup Progress 


Installing: 
Python 3.7.0 Executables (64-bi 
3 ss aa | 


windows aa 
1-9 ”安装 进行 中 
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( 6 ) 待 安装 完成 会 得 到 如 图 1-10 所 示 的 安装 成 功 界面 。 单 击 Close 按钮 ， 安 装 工作 就 完成 了 。 
Python 的 安装 是 不 是 很 简单 ? 


Python 37.0 (64-bit) Setup 














ed | 





Setup was successful 


Special thanks to Mark Hammond, without whose years of 
freely shared Windows expertise, Python for Windows would 


still be Python for DOS. 
New to Python? Start with the online tutorial and 
documentation. 


See whats new in this release. 











puthon 











windows 





图 1-10 安装 完成 
ER3 软件 安装 成 功 后 ， 查 看 你 安装 的 软件 是 否 能 成 功 运行 ( 此 处 以 Windows 7 系统 为 例 ， 
其 他 相关 系统 可 以 查找 对 应 信息 进行 查看 )。 
单 击 计算 机 上 的 “开始 ”按钮 ， 可 以 看 到 如 图 1-11 所 示 的 输入 框 ， 在 输入 框 中 输入 cmd 三 个 
字符 ， 如 图 1-12 所 示 。 








| 一 关 凯 一 | -| | 





图 1-11 输入 框 图 1-12 输入 cmd 


输入 cmd 后 按 Enter 键 ， 得 到 如 图 1-13 所 示 的 cmd 命令 界面 。 
画 CWindows\system32\emdexe 汪汪 ER = le | 


icrosoft Windows 【版本 6-1.2681] 
版 权 所 有 ce》2989 Microsoft Corporation。 保 留 所 有 权利 








:NisersNlyz》 











图 1-13 cmd 命令 界面 
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在 cmd 命令 界面 输入 python 字符 , 输入 完成 后 按 Enter 键 , 得 到 如 图 1-14 所 示 的 界面 。 其 中 ， 
方 框 所 示 为 输入 的 字符 ， 下 面 打 印 了 一 些 安装 信息 ， 椭 圆圈 标注 的 为 安装 Python 的 版 本 ， 当 前 安 
装 的 是 3.7.0 版 本 。 输 入 python 命令 后 ， 进 入 Python 控制 台 ， 可 以 在 这 里 输入 命令 并 得 到 相应 结 
果 ， 此 处 不 做 进一步 讲解 ， 在 下 一 章 会 具体 介绍 。 
| Windows\system3 Ncmd,exe - python 


osoft Windows [| 版 本 6.1.7691] 
c] 2669 Hicrosoft Corporation。 保留 所 有 权利 。 








| 


7-6:1bf9cc5093, Jun 27 2618, Q4:59:51) [MSC u.1914 64 bit (AMD| 


“, “credits™ or “license” for more information. 


1-14 Python 命令 


此 处 输入 python 命令 看 到 的 信息 比较 多 ， 若 只 想 查 看 版 本 信息 ， 可 输入 命令 --version， 如 图 
1-15 所 示 。 该 命令 的 使 用 方式 为 : python --version。 从 输出 结果 可 以 看 到 ， 信 息 非 常 简单 明了 ， 结 
果 为 Python ， 版 本 是 3.7.0, 和 图 1-14 的 结果 是 一 样 的 , 但 没有 图 1-14 中 的 其 他 信息 。 注 意 version 
前 面 有 两 个 “-” 符 。 从 图 1-15 可 以 看 到 ， 退 出 Python 控制 台 的 命令 为 exit()。 


[ET 
soft Corporation。 习 


Ic:\Users\1yz>python 
python 3.7.6 (u3.7.9:1bf9cc5693，Jun 27 2818, 84:59:51) [MSC v.1914 64 bit (AMD6| 
4) ] on win32 

copuright”, “credits” or “license” for more information 


C:\Users\1yz>python --uersion 
Puthon 3.7.9 


C:\Users\1yz> 











图 1-15 查看 Python 版 本 的 信息 


到 此 为 止 ，Python 环境 总 算是 搭建 完成 了 。 如 果 在 图 1-5 中 没有 勾 选 Add Python 3.7 to PATH 
会 怎么 样 呢 ? 

若 在 安装 时 没有 勾 选 Add Python 3.7 to PATH， 则 在 图 1-14 中 操作 时 会 得 到 如 图 1-16 所 示 的 
结果 。 
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画 C\WWindows\system32\emd.exe 


t Windows [上 脾 本 6.1.2681] 
版 权 所 有 《cc》2689 Microsoft Corporation。 保 留 所 有 权利 。 


a] > 


Nyz>python 
是 内 部 或 外 部 命令 ， 也 不 是 可 运行 的 程序 


je: users\lyz> 





1-16 未 勾 选 Add Python 3.7 to PATH 显示 的 结果 


Windows 会 根据 Path 环境 变量 设 定 的 路 径 查找 python.exe， 如 果 没 找到 就 会 报错 。 因 此 ， 如 
果 在 安装 时 漏 掉 了 勾 选 Add Python 3.7 to PATH, 就 要 手动 把 python.exe 所 在 的 路 径 添加 到 Path 中 。 

如 果 不 喜 欢 手 动 修改 环境 变量 ， 可 以 把 Python 安装 程序 重新 运行 一 裔 ， 务 必 记 得 勾 选 Add 
Python 3.7 to PATH。 

如 果 想 尝试 添加 环境 变量 ， 可 以 执行 以 下 操作 。 

EX) 选择 “开始 ”一 “计算 机 ”( 找到 计算 机 就 可 以 ) 选中 并 右 击 计算 机 ， 在 弹出 的 菜单 
“属性 "， 弹 出 如 图 1-17 所 示 的 界面 。 
































印记 四 三 统 设置 < 


系统 
分 辆 ws--: 
处 理 器 Iintel(R) Core(TM) i5-4200U CPU @ 1.60GHz 1.60 GHz 
安装 内 存 (RAM): 160GB 
es 人 4 位 强人 至 统 
笔 和 星 乔 : 没有 可 用 于 此 呈 示 器 的 笔 或 对 近 给 入 
计算 机 会 你、 送 和 工作 后 设置 
振作 中 心 
he 
Windows Update WPC 
hz-PC 


性 这 信 息 和 工具 





Service Pack 1 





图 1-17 计算 机 属性 


sll) 

© | , sms ,Frie 人 ,sw | 好 ‖ Er pl 

文件 (月 ” 妨 加 (E) ”天 看 (V) 工具 (T) 帮助 (H) 

©- 

| ee 查看 有 关 计 算 机 的 基本 信息 

加 设 和 生理 中 Windows 版 本 

可 ER Windows 7 族 明 上 | 

四 于 版 权 所 有 名 2009 Microsoft Corporation。 保 加 所 有 权利 . 
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C02 单 击 “高 级 系统 设置 ”( 图 中 箭头 所 指 )， 弹 出 如 图 1-18 所 示 的 “系统 属性 ”界面 。 
C03 该 界面 默认 显示 “高 级 ”菜单 界面 ， 如 果 进 入 后 显示 的 不 是 “高 级 ”菜单 界面 ， 就 手 
动 选择 “高 级 ”菜单 。 在 该 界面 的 右 下 角 单 击 “ 环 境 变 量 ” 按 钮 ， 得 到 如 图 1-19 所 示 的 界面 。 





















































































出 件 《高 级 | 系统 保护 | 运 
ld 和 lyz 的 用 户 变 量 0 
要 进行 大 多 数 更 改 ， 您 必须 作为 管理 员 登 录 。 
性 能 变星 什 上 | 
视觉 效果 ， 处 理 器 计划 ， 内 存 使 用 ， 以 及 虚拟 内 存 WOZ_PLUGTN_PATH F:\tool\office\pdE\plugins\ 日 
了 PATH E:\python\pythoninstall\Scripts. .. 
有 TENP WUSERPROFILEX\AppData\Locsl\Temp 
TWP WISRRPRNPTI RX\ nnNatay oral Tenn 了 
用 户 配置 文件 | 
与 您 登录 有 关 的 点 面 设置 (WEm... ] (MD. MAD 
设置 呈 . 
启 :和 地 障 恢复 
系统 启动 、 系 统 失 册 和 i 区 信息 
ee 
由 
ET | 新 汗 0D... ] [编辑 中..，] [ 量 除 已 
有 
网 
一 

















图 1-18 系统 属性 图 1-19 环境 变量 


3704 双击 图 1-19 中 箭头 所 指 的 Path， 弹 出 “编辑 用 户 变量 ”界面 ， 在 界面 的 “变量 值 " 
输入 框 中 加 入 Python 的 安装 路 径 ( 如 Ex\python\python37 )， 如 图 1-20 所 示 。 


环境 去 量 08 pen Lx] 









































变量 值 四 
CLASSPATH TAVA HONENNLID: ATAVA HONEXN1... [i 
ConSpec C: Windows\systen32\cnd. exe 
FPO_JOSTC... WO 

HnWR WISRRPRNFTI RY 二 











[B 建 由 ] [ 编 加 中 .,,] [ 出 祭 00 


巨 枉 二 己 38 























1-20 ”编辑 用 户 变量 


注意 ， 变 量 值 中 的 内 容 可 以 英文 分 号 (;) 开始 ， 并 以 \ 结 尾 ， 如 :;E:\python\python3 了 \。 单 击 “ 确 
定 ” 按 钮 可 回 到 图 1-19, 在 图 1-19 中 单 击 “ 确 定 ”按钮 ， 可 回 到 图 1-18， 在 图 1-18 中 单 击 “确定 ” 
按钮 ， 环 境 变量 就 添加 成 功 了 。 接 下 来 就 可 以 按照 图 1-11~ 图 1-14 所 示 进 行 操作 。 
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至 此 ， 在 Windows 上 安装 Python 就 结束 了 。 


1.5.2 在 Linux、UNIX 系统 和 Mac 中 安装 Python 


如 果 你 正在 使 用 Linux 系统 ， 而 且 有 Linux 系统 管理 经 验 ， 自 行 安装 Python 3 就 没有 问题 ， 
否则 请 换 回 Windows 系统 。 





在 绝 大 多 数 Linux 和 UNIX 系统 中 ，Python 解释 器 已 经 存在 了 ， 但 是 预 装 的 Python 版 本 一 般 
都 比较 低 ， 很 多 Python 的 新 特性 都 没有 ， 必 须 重新 安装 新 版 本 。 

如 果 你 正在 使 用 Mac， 系 统 是 OS X 10.8~10.10， 系 统 自 带 的 Python 版 本 是 2.7。 

由 于 Linux、UNIX 和 Mac 的 版 本 比较 多 ， 并 且 在 各 版 本 下 的 安装 有 所 差异 ， 此 处 为 不 误导 大 
家 , 不 编写 安装 示例 ， 大 家 根据 自己 所 使 用 的 版 本 到 网 上 查找 相关 资源 ,在 网 上 会 得 到 更 明确 的 安 
装 指 导 和 帮助 。 





1.5.3 ”其 他 版 本 


除了 官方 提供 的 Python 版 本 外 ， 还 有 多 个 版 本 可 供 选择 ， 最 有 名 的 为 ActivePython， 使 用 于 
Linux、Windows、Mac OSX 以 及 多 个 UNIX 内 核 版 本 。ActivePython 是 由 ActiveState 发 布 的 Python 
版 本 。 这 个 版 本 的 内 核 与 使 用 于 Windows 中 的 标准 Python 发 布 版 本 相同 ， 而 ActivePython 包含 许 
多 额外 独立 的 可 用 工具 。 如 果 用 的 是 Windows 系统 ， 那 么 ActivePython 值得 尝试 一 下 。 

Stackless Python 是 Python 的 重新 实现 版 本 ， 基 于 原始 的 代码 ， 也 包含 一 些 重要 的 内 部 改动 。 
对 于 入 门 用 户 来 说 ， 两 者 并 没有 多 大 区 别 ， 标 准 的 发 布 版 反而 更 好 用 。Stackless Python 最 大 的 优 
点 是 允许 深层 次 递归 ， 并 且 多 线程 执行 更 加 高 效 。 不 过 这 些 都 是 高 级 特性 ， 一 般 用 户 并 不 需要 。 

Jython 和 IronPython 与 以 上 版 本 大 有 不 同一 一 它们 都 是 其 他 语言 实现 的 Python。jJython 利用 
Java 实现 ， 运 行 在 Java 虚拟 机 中 ;IronPython 利用 C# 实 现 ， 运 行 于 公共 语言 运行 时 的 NET 和 Mono 中 。 














1.6 从 Hello World 开始 


经 过 前 面 几 个 小 节 的 介绍 ， 现 在 你 是 否 跃 跃 欲 试 ? 下 面 将 带 你 进入 Python 的 实战 。 

英文 的 “你 好 ， 世 界 ” 怎 么 说 呢 ? “Hello,world”。 怎 么 在 Python 中 将 这 个 效果 展现 出 来 呢 ? 

安装 好 Python 后 ， 在 “开始 ”菜单 栏 中 会 自动 添加 一 个 Python 3.7 文件 夹 ， 单 击 该 文件 夹 会 
出 现 如 图 1-30 所 示 的 子 目录 。 na 

可 以 看 到 ，Python 目录 下 有 4 个 子 目 录 ， 从 上 到 下 依次 是 2 IDLE (Python 37 64-bit) 
IDLE、 Python 3.7、 Python 3.7 Manuals 和 Python 3.7 Module Docs。 ry Er py ee (64-bid 
IDLE 是 Python 集成 开发 环境 ， 也 称 交 互 模式 ， 具 备 基 本 的 IDE 已 python 37 Module Docs (64-bit) 
功能 ， 是 非 商业 Python 开发 的 不 错 选择 ， Python 3.7 是 Python 的 1-30 Python 菜单 
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命令 控制 台 ， 窗 口 跟 Windows 下 的 命令 窗口 一 样 ， 不 过 只 能 执行 Python 命令 ; Python 3.7 Manuals 
是 帮助 文档 ， 不 过 是 全 英文 的 ，Python 3.7 Module Docs 是 模块 文档 ， 单 击 后 会 跳 转 到 一 个 网 址 ， 
可 以 查看 目前 集成 的 模块 。 本 书 若 无 特别 指出 ， 示 例 都 是 在 IDLE 中 执行 的 。 

下 面 正式 进入 Hello world 的 世界 。 打 开交 互 模式 ， 如 图 1-31 所 示 。 


BW python 3.7 (64-bit} seampe 








图 1-31 Python 交互 模式 


>>> 表 示 在 Python 交互 式 环境 下 。 在 Python 交互 式 环境 下 只 能 输入 Python 代码 并 立刻 执行 。 

在 交互 式 环境 下 输入 print (Hello,world!)， 按 回 车 键 后 ， 可 以 看 到 输出 了 “Hello,world!”， 如 
图 1-32 所 示 。 此 处 print 后 面 带 了 括号 ， 表 示 print 是 一 个 函数 〈 函 数 的 概念 将 会 在 后 面 的 章节 单 
独 进行 讲解 ) ， 单 引号 里 面 的 叫 字符 串 。 如 果 要 让 Python 打印 指定 的 文字 ， 就 可 以 用 print0 函 数 。 
把 要 打印 的 文字 用 单 引号 或 双 引 号 括 起 来 ， 但 单 引号 和 双 引 号 不 能 混用 。 








Python 3.7-9b2 《v3.7.9b2:bhBef5c979b。Feb 28 2818, 82:24:28> [MSC v.1912 64 bit《“ 


ee on win32 
“help"”, “copyright", “credits" or "license" for nore infornation. 
py” printC’Hello,worldt’) 4— 
Tlor vorldy 
>> 





图 1-32 ”Python 输入 输出 
17 调 试 


在 计算 机 前 阅读 本 书 是 一 个 好 主意 ， 你 可 以 边 看 书 边 试验 书 中 的 示例 。 每 当 学 习 新 的 语言 特 
性 时 , 应 当 尝 试 犯错 误 , 因为 错误 会 帮助 你 记 住所 学 的 内 容 , 也 会 帮助 你 在 日 后 的 应 用 中 少 走 弯路 。 
就 像 俗话 说 的 : 吃 一 第 长 一 智 。 

我 们 以 1.6 节 的 “Hello,world!” 为 例 ， 将 print (Hello,world!) 修 改 为 print (Hello,world0)， 去 掉 
后 面 的 单 引号 ， 在 交互 模式 下 测试 一 下 。 

输入 以 下 语句 : 

print ('Hello,world!) 

可 以 看 到 ， 屏 幕 输出 结果 如 图 1-33 所 示 。 

WW python 3.7 (64-bit} 


Python 3.7.8Gh2 Cv3.7.8hb2:bBef5c979b, Feb 28 2818,. @2:24:28> [MSC v.1912 64 bit < ~ 
AMD64)] on win32 


ype "help"。 "copyright"。 "credits" or "license"” for more infornation. 一 











File <stdin3™,. Tine I 
printC’Hello,.worldt > | 


ByntaxError: EOL while scanning string literal 











图 1-33 Python 错误 尝试 1 
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输出 了 一 行 红色 的 信息 ， 内 容 如 下 : 

SyntaxError: EOL while scanning string literal 

这 是 什么 意思 呢 ? 如 果 不 明白 ， 可 以 先 借助 网 络 或 其 他 工具 查找 ， 后 面 见得 多 了 就 知道 是 什 
么 意思 了 。 这 在 本 书 中 是 第 一 次 碰 到 ， 解 释 一 下 ， 意 思 为 : 语法 错误 ， 当 扫描 字符 串 时 发 生 错误 。 

通过 这 个 错误 ， 看 到 相关 的 错误 信息 时 应 当 能 很 快 知道 问题 的 原因 。 

若 把 第 一 个 单 引 号 去 除 又 会 发 生 什么 情况 呢 ， 是 否 会 和 上 面 报 同 样 的 错误 ? 下 面 动手 实践 一 下 。 

输入 以 下 语句 : 


Print (Hello,world!') 


运行 结果 如 图 1-34 所 示 。 








ython 3.7.8b2 Cv3.7.8b2:hBef5c979b, Feb 28 2818, 82:24:28> [MSC v.1912 64 bit 《 “^ 
MD64)] on win32 | 
‘ype “help", "copyright", “credits" or “license" for more information. 
22> printCHello,worldt’) 他 一 
File stdin)", line 1 
printCHello,.worldt’ > 





SyntaxError: invalid syntax 





图 1-34 ”Python 错误 尝试 2 


可 以 看 到 ， 错 误 信息 和 图 1-33 报 的 不 一 样 。 大 家 可 以 通过 犯错 发 现 更 多 有 趣 的 现象 ， 此 处 就 
不 再 列举 更 多 的 例子 了 。 


1.8 “问题 解答 


本 章 介绍 了 Python 的 发 展 历程 、 Python 的 安装 和 一 个 简单 示例 的 相关 操作 , 虽然 是 入 门 知识 ， 
但 是 在 操作 过 程 中 也 会 遇 到 问题 。 下 面 结合 笔者 的 经 验 和 其 他 人 的 分 享 做 一 些 问题 解答 。 
(1) 要 学 习 本 书 的 内 容 ， 一 定 要 安装 最 新 版 本 的 Python 吗 ? 
答 : 建议 安装 最 新 版 本 。 毕 竟 技 术 在 不 断 更 新 ， 对 于 新 手 来 说 ， 学 习 最 新 版 本 一 般 是 最 好 的 
切入 方式 ， 若 不 想 安装 最 新 版 本 ， 建 议 安 装 3 以 上 的 版 本 。 
(2) 企业 大 部 分 都 用 2.7 版 本 ， 我 学 习 3 以 上 的 版 本 ， 是 不 是 到 了 企业 还 得 学 习 2.7? 
答 : 大 部 分 企业 不 会 如 此 。 既 然 Python 已 经 发 展 到 了 3.7 版 本 ， 并 且 3 以 上 的 版 本 比 2 版 本 
有 了 不 少 改 进 和 优化 ,企业 肯定 也 要 与 时 俱 进 ， 有 些 企 业 可 能 由 于 历史 原因 需要 维护 老 项 目 ， 需 要 
用 到 Python 2 版 本 的 知识 ， 更 多 企业 还 是 会 用 Python 3 以 上 的 版 本 开发 的 。 
(3) 下 载 后 出 现 modify setup 和 setup failed， 重 新 下 载 也 是 这 样 ， 该 怎么 办 呢 ? 
答 : 该 问题 出 现 的 原因 一 般 是 操作 系统 版 本 太 低 。 建 议 大 家 学 习 时 安装 主流 的 系统 ， 这 样 大 
部 分 软件 安装 时 就 不 会 存在 操作 系统 版 本 低 或 操作 系统 不 兼容 等 问题 。 
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1.9 温 故 知 新 ， 学 以 致 用 


章节 回顾 : 














可 顾 一 下 Python 的 发 展 历程 ， 即 起 源 、 应 用 场景 。 
思考 并 解决 如 下 问题 : 
(1) 在 本 地 安装 Python 最 新 版 本 ， 安 装 好 后 卸载 ， 务 载 后 再 安装 ， 尽 量 关注 一 下 各 个 步骤 的 


(2) 尝试 在 不 同 操作 系统 上 安装 Python。 
(3) 在 “Hello, world!” 示 例 中 ， 尝 试 将 print 函数 拼写 错误 ， 查 看 输出 结果 。 
(4) 不 要 用 计算 机 测试 ， 自 己 想 想 print (1+2) 的 输出 结果 。 
s 试 打印 出 中 文 。 
打印 出 一 个 长 句 。 
(7) 尝试 打印 出 一 个 段落 ， 保 持 段 落 的 格式 ， 有 换行 和 句 首 缩 进 。 
(8) 思考 加 减 乘除 的 实现 ， 并 打印 出 结果 。 
(9) 用 print 函数 打印 一 句 既 有 中 文 又 有 英文 字母 的 话 。 
(10) 查阅 相关 资料 ， 打 印 出 混合 运算 的 结果 表达 式 。 








扫 码 看 视频 





第 2 章 
开启 Python 之 旅 


本 章 主要 介绍 Python 的 基础 知识 ， 为 后 续 章节 学 习 相关 内 容 做 铺垫 。 
2.1 认识 程序 


旅行 前 ， 我 们 要 先 熟 悉 地 名 ， 知 道 去 哪里 旅行 ， 将 会 经 过 哪里 。 学 习 编程 语言 也 一 样 ， 在 学 
习 之 前 要 先 了 解 程序 、 调 试 、 语 法 错误 、 运 行 错误 、 语 义 错 误 等 知识 。 


2.1.1 程序 


我 们 都 知道 ， 出 门 旅行 肯定 要 选择 交通 工具 ， 现 在 常用 的 交通 工具 有 飞机 、 火 车 、 轮 船 、 汽 
车 等 ， 我 们 会 根据 自己 的 喜好 和 一 些 其 他 因素 选择 对 应 的 交通 工具 。 

编程 语言 也 一 样 ， 我们 选择 一 门 编程 语言 就 相当 于 选择 一 种 交通 工具 ， 那么, 编程 语言 的 “ 交 
通 ” 工 具 是 什么 呢 ? 是 程序 。 

程序 是 指 根据 语言 提供 的 指令 按照 一 定 逻 辑 顺 序 对 获得 的 数据 进行 运算 ， 并 最 终 返回 给 我 们 
的 指令 和 数据 的 组 合 。 在 这 里 , 运算 的 含义 是 广泛 的 ， 既 包括 数学 计算 之 类 的 操作 (如 加 、 减 、 乘 、 
除 ) ， 又 包括 寻找 和 蔡 换 字符 串 之 类 的 操作 。 数 据 依 据 不 同 的 需要 组 成 不 同 的 形式 ， 处 理 后 的 数据 
也 可 能 以 另 一 种 方式 体现 。 

程序 是 用 语言 写成 的 ， 语 言 分 高 级 语言 和 低级 语言 。 

低级 语言 有 时 叫 机 器 语言 或 汇编 语言 。 计 算 机 真正 “认识 ”并 能 够 执行 的 代码 ， 在 我 们 看 来 
是 一 串 0 和 1 组 成 的 二 进 制 数字 , 这 些 数字 代表 指令 和 数据 。 早期 的 计算 机 科学 家 就 是 用 这 些 枯燥 
乏味 的 数字 编程 . 低级 语言 的 出 现 是 计算 机 程序 语言 的 一 大 进步 , 它 用 英文 单词 或 单词 的 缩写 代表 
计算 机 执行 的 指令 ,使 编程 的 效率 和 程序 的 可 读 性 都 有 了 很 大 提高 ,但 它 仍然 和 机 器 硬件 关联 紧密 ， 
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不 符合 人 类 的 语言 和 思维 习惯 ， 而 且 要 想 把 用 低级 语言 写 的 程序 移植 到 其 他 平台 ， 就 必须 重 写 。 

高 级 语言 的 出 现 是 程序 语言 发 展 的 必然 结果 ， 也 是 计算 机 语言 向 人 类 的 自然 语言 和 思维 方式 
逐步 靠近 和 模拟 的 结果 。 由 于 高 级 语言 是 对 人 类 逻辑 思维 的 描述 , 用 高 级 语言 写 程序 会 感到 比较 自 
然 ， 读 起 来 也 比较 容易 ， 因 此 现在 大 部 分 程序 都 是 用 高 级 语言 写 的 。 

高 级 语言 设计 的 目的 是 让 程序 按照 人 类 的 思维 和 语言 习惯 书写 ， 是 面向 人 的 ， 而 不 是 面向 机 
器 。 我 们 用 着 方便 ， 机 器 却 无 法 读 懂 ， 更 谈 不 上 运行 。 所 以 ,， 用 高 级 语言 写 的 程序 必须 经 过 “翻译 ” 
程序 的 处 理 ， 将 其 转换 成 机 器 可 执行 的 代码 ,才能 运行 在 计算 机 上 。 如 果 想 把 高 级 语言 写 的 程序 移 
植 到 其 他 的 平台 ， 只 需 在 它 的 基础 上 做 少量 更 改 就 可 以 了 。 

高 级 语言 翻译 成 机 器 代码 有 两 种 方法 ， 即 解释 和 编译 。 

解释 型 语言 是 边 读 源 程 序 边 执行 。 高 级 语言 就 是 源 代码 。 解 释 器 每 次 会 读 入 一 段 源 代码 ， 并 
执行 它 ， 接 着 再 读 入 并 执行 ， 如 此 重复 ， 直 到 结束 ， 图 2-1 显示 了 解释 型 语言 的 执行 方式 。 这 个 有 
点 类 似 在 乡村 里 搭乘 公交 ， 只 要 碰 到 路 上 有 人 等 公交 ， 就 停 下 来 载 人 。 

编译 型 语言 是 将 源 代码 完 整地 编译 成 目标 代码 后 才能 执行 ， 以 后 在 执行 时 不 需要 再 编译 。 图 
2-2 显示 了 编译 型 语言 的 执行 方式 ， 这 个 有 点 类 似 我 们 乘坐 的 直达 车 ， 所 有 要 乘 车 的 人 都 从 起 点 上 
车 ， 中 途 不 再 搭载 其 他 乘客 。 


一 区 一 
De 


图 2-1 解释 型 语言 的 执行 方式 


- 回 - Rs - 国 -J 
Le | 


图 2-2 编译 型 语言 的 执行 方式 





2.1.2 调试 


每 当 远 游 时 ， 司 机 肯定 要 做 几 件 事 情 ， 如 检查 发 动机 是 否 正常 、 检 查 油箱 、 检 查 各 项 安全 系 
统 和 液压 系统 等 ， 为 的 是 尽 可 能 减少 在 路 途中 发 生意 外 情况 。 

编程 也 是 一 样 的 ， 需 要 经 常 做 检查 。 有 一 些 问题 编译 器 会 帮助 我 们 检查 出 来 ， 问 题 查 出 后 ， 
简单 的 可 以 直接 解决 ， 对 于 稍微 复杂 的 ， 需 要 通过 调试 来 解决 。 

程序 是 很 容易 出 错 的 。 程 序 错误 被 称 为 bug， 查 找 bug 的 过 程 称 为 调试 (debugging) 。 我 们 
在 第 1 章 中 已 经 介绍 过 一 个 很 简单 的 调试 示例 。 


2.1.3 ”语法 错误 


在 生活 中 有 时 会 碰 到 这 样 的 情况 ， 你 本 应 买 今天 去 某 地 的 火车 票 ， 已 经 买好 了 ， 但 当 进 站 检 
票 时 ， 系 统 告诉 你 票 不 是 今天 的 ， 这 时 你 才 发 现 购买 车 票 时 输 错 了 日 期 。 
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程序 中 这 种 错误 比 生活 中 出 现 的 次 数 多 很 多 ， 称 为 语法 错误 (syntax errors) 。Python 程序 在 
语法 正确 的 情况 下 才能 运行 , 否则 解释 器 会 显示 一 条 错误 信息 。 语法 指 的 是 程序 的 结构 和 此 结构 的 
规则 ， 比 如 第 1 章 的 (Hello,world!)， 括 号 中 的 单 引 号 是 成 对 的 ， 执 行 时 才能 正确 执行 。 如 果 输 入 
('Hello,world!) 或 (Hello,world!") 就 会 报错 ， 这 属于 语法 错误 。 

我 们 在 阅读 文章 或 听 人 讲话 时 ， 可 以 容忍 大 多 数 语法 错误 ， 不 过 Python 并 不 如 此 宽容 。 程 序 
中 只 要 出 现 一 处 语法 错误 ,就 会 显示 错误 信息 并 退出 ， 从 而 无 法 通过 编译 。 就 如 我 们 进 站 , 一 旦 票 
不 满足 进 站 要 求 ， 就 无 法 进入 一 样 。 

在 编程 生涯 的 开始 阶段 ， 可 能 每 踏 出 一 步 都 会 碰 到 大 量 语法 方面 的 错误 ， 随 着 经 验 的 增加 ， 
犯错 会 减少 ， 踩 过 “ 坑 ” 后 ， 后 面 遇 到 类 似 的 “ 坑 ” 就 能 快速 应 对 了 。 


2.1.4 ”运行 错误 


我 们 在 奔跑 的 交通 工具 内 愉悦 地 欣赏 着 远 途 的 风景 ， 但 此 时 交通 工具 突然 慢 慢 停 下 来 了 ， 并 
且 司 机 对 大 家 宣布 说 ， 交 通 工 具 抛锚 了 。 例 如 ， 出 现 轮胎 破损 、 没 油 了 、 发 动机 坏 了 、 撞 车 事故 等 。 

在 Python 中 经 常会 遇 到 类 似 的 错误 ， 称 之 为 运行 时 错误 (runtime errors) 。 

即使 是 看 起 来 完美 无 缺 的 程序 ， 在 运行 的 过 程 中 也 会 出 现 错误 。 有 人 说 ， 计 算 机 不 是 善于 精 
确 计算 吗 ? 确实 如 此 。 不 过 错 的 不 是 计算 机 ， 而 是 我 们 人 类 。 计 算 机 说 到 底 是 人 类 设计 的 ， 是 我 们 
所 用 的 工具 ， 和 电视 机 、 汽 车 从 本 质 上 来 说 是 一 样 的 。 鉴 于 现在 计算 机 软 硬 件 的 理论 水 平 、 工 业 制 
造 水 平 、 使 用 者 的 水 平等 一 些 内 在 、 外 在 的 因素 ， 出 现 错误 并 不 稀奇 ， 且 程序 越 复杂 ， 出 现 异 常 的 
概率 越 大 。 异 常 的 种 类 很 多 ， 如 内 存 用 尽 、 除 数 为 零 的 除法 等 都 可 能 导致 异常 。Python 为 了 把 错 
误 的 影响 降 至 最 低 ， 提 供 了 专门 的 异常 处 理 语句 。 

运行 时 错误 一 般 在 代码 量 偏 多 时 才 容 易 遇 到 。 


2.1.5 ”语义 错误 


经 常 乘坐 交通 工具 ， 难 免 有 乘 错 车 的 情况 出 现 ， 比 如 你 本 应 该 乘坐 801 路 车 ， 却 坐 上 了 802 
路 车 ， 结 果 到 达 了 不 同 的 地 方 。 

在 Python 中 经 常会 发 生 类 似 的 问题 ， 此 类 问题 称 为 语义 错误 (semantic errors) 。 

程序 即使 有 语义 错误 ， 也 能 正常 运行 ， 不 会 产生 任何 错误 信息 ， 但 得 到 的 结果 和 我 们 预料 的 
不 一 致 。 发 生 这 种 错误 一 般 是 我 们 对 语句 的 运行 机 制 了 解 得 不 够 透彻 ， 自 以 为 它 应 该 如 此 运行 , 实 
际 上 却 不 是 这 样 。 还 有 可 能 是 你 解决 问题 的 思路 本 身 就 是 错 的 ， 写 的 程序 当然 是 错 的 。 

查找 语义 错误 并 不 像 我 们 坐 错 了 车 那么 容易 ， 它 可 能 需要 你 根据 结果 进行 推理 ， 不 过 推理 的 
过 程 没有 那么 简单 易 行 ， 需 要 查看 程序 输出 ， 并 尝试 弄 明 白 到 底 做 了 什么 。 


2.2 ”数据 类 型 


计算 机 是 可 以 做 数学 计算 的 机 器 ， 计 算 机 程序 理所当然 可 以 处 理 各 种 数值 。 计 算 机 能 处 理 的 
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远 不 止 数值 ， 还 有 文本 、 图 形 、 音 频 、 视 频 、 网 页 等 各 种 各 样 的 数据 ， 不 同 的 数据 需要 定义 不 同 的 
数据 类 型 。Python 3 中 有 6 种 标准 的 对 象 类 型 : Number (数字 ) 、String (字符 串 ) 、List (列表 ) 、 
Tuple〈 元 组 ) 、Sets (集合 ) 、Dictionary (字典 ) 。 本 节 首 先 讲解 Number 数据 类 型 ， 其 他 5 种 
数据 类 型 在 后 续 章 节 介 绍 。 

Python 3 支持 3 种 不 同 的 数值 类 型 : 整 型 (int) 、 浮 点 型 (float) 、 复 数 (complex) 。 


2.2.1 整 型 


int 通常 被 称 为 整 型 或 整数 ， 是 正 、 负 整数 ， 不 带 小 数 点 。 在 Python 3 中 ， 整 型 没有 限制 大 小 ， 
可 以 当 作 long 类 型 使 用 ， 所 以 Python 3 没有 Python 2 的 long 类 型 。 

例如 ， 公 司 组 织 旅游 ， 大 家 坐 上 了 大 巴 准 备 出 发 ， 现 在 需要 统计 有 多 少 人 在 车 上 ， 老 板 吟 只 
小 萌 清 点 一 下 人 数 ， 小 萌 花 了 两 分 钟 逐 个 点 了 一 遍 ， 总 计 51 人 。 小 萌 在 交互 模式 下 输入 : 

>>> 51 

51 

这 里 使 用 的 是 整 型 。 

到 服务 区 后 ， 大 家 休息 了 一 下 ， 再 次 准备 出 发 时 ， 老 板 又 吟 只 小 萌 清 点 一 下 人 数 。 小 萌 苦 笑 
一 下 , 看 来 又 得 花 两 分 钟 清点 人 数 了 , 为 什么 不 叫 一 个 人 帮忙 从 车 的 另 一 头 清点 呢 ? 于 是 小 萌 叫 小 
智 帮忙 从 另 一 头 清点 一 下 人 数 。 一 分 钟 后 ， 小 萌 和 小 智 在 车 中 间 碰 上 了 ,小 智 告诉 小 萌 他 的 计数 是 
25 人 ， 小 萌 在 交互 模式 下 输入 : 

>>> 25+25 

50 

小 萌 准 备 把 数字 报告 给 老板 ， 突 然 想到 上 次 报告 的 是 51 人 ， 这 次 是 50 人 ， 数 字 不 同 啊 ， 还 
差 1 人 ， 小 萌 在 交互 模式 下 输入 : 

>>> 51-50 

1 

怎么 少 了 一 人 呢 ? 小 萌 突然 慌 了 ， 然 后 仔细 一 想 ， 原 来 是 把 自己 忘 如 上 了 ， 于 是 再 次 输入 : 


>>> 25+25+1 
51 


这 次 没 问题 了 。 于 是 小 萌 给 了 老板 和 上 次 一 样 的 答案 。 老 板 示意 司机 可 以 发 车 了 ， 又 突然 叫 
停 ， 看 天 气 挺 热 的 ， 大 家 路 上 可 能 会 口 渴 ， 于 是 吟 只 小 萌 去 服务 区 给 每 人 买 两 瓶 水 ， 再 买 一 大 包 糖 
给 大 家 在 路 上 补充 能 量 。 每 人 两 瓶 水 ， 一 共 要 买 多 少 瓶 呢 ? 小 萌 在 交互 模式 下 输入 : 

>>> 5 

102 

一 共 要 买 102 瓶 水 ， 这 么 多 ， 于 是 小 萌 让 小 智 帮忙 一 起 去 提 水 。 

水 和 糖 都 买 回 来 了 ， 水 好 分 ， 给 每 人 两 瓶 就 是 ， 这 一 大 包 糖 该 怎么 给 大 家 呢 ? 看 包装 袋 上 有 
总 颗 数 ， 一 共有 153 颗 ， 每 人 多 少 颗 呢 ? 小 萌 在 交互 模式 下 输入 : 


>>> 153/51 
3.0 
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好 了 ,给 每 人 发 3 颗 糖 就 可 以 了 。 于 是 小 萌 高 高 兴 兴 发 糖 去 了 ， 小 智也 帮忙 一 起 发 ， 每 人 给 3 
颗 。 糖 终于 发 完了 ， 小 萌 很 民意 ， 坐 下 来 补充 能 量 。 小 萌 突 然 想 到 了 什么 ， 有 153 颗 糖 ， 分 给 51 
人 , 每 人 3 颗 糖 没 错 , 但 计算 出 来 的 结果 怎么 是 3.0 呢 ? 假如 有 155 颗 糖 , 计算 结果 会 是 怎样 的 呢 ? 
输入 以 下 数据 : 


>>> 155/51 
3.0392156862745097 


如 果 按 这 个 结果 分 ， 就 没有 办 法 分 了 。 这 是 怎么 回 事 呢 ? 

原因 是 : 在 整数 除法 中 ， 除 法 〈/) 计算 结果 是 浮 点 数 ， 即 使 两 个 整数 恰好 整除 ， 结 果 也 是 浮 
点 数 。 如 果 只 想得到 整数 的 结果 ,丢弃 可 能 的 分 数 部 分 ， 可 以 使 用 地 板 除 (/) ， 整数 的 地 板 除 (//) 
永远 是 整数 ， 即 使 除 不 尽 。 

更 改 前 面 输入 的 数据 : 


>>> 153//51 
3 


这 时 就 不 是 浮 点 数 了 。 再 看 看 155 颗 糖 的 结果 : 


>>> 155//51 
3 


153 和 155 除 以 51 都 是 3， 这 个 就 不 对 了 。 原 来 还 有 一 个 余数 。 
因为 地 板 除 (//) 只 取 结 果 的 整数 部 分 ， 所 以 Python 提供 了 一 个 余数 运算 , 可 以 得 到 两 个 整数 
相 除 的 余数 ， 看 看 153 和 155 对 51 的 取 余 : 


>>> 153%51 

0 

>>> 155%51 

加 

这 次 的 结果 就 是 想 要 的 了 。 假 如 有 155 颗 糖 ， 就 会 多 出 2 颗 。 小 萌 细 细 想 着 ， 嘴 角 泛 起 一 丝 
自然 的 微笑 ， 小 智也 发 完 糖 了 ， 过 来 向 小 萌 汇 报 ， 看 见 小 萌 的 表情 ， 小 智 心里 顿时 暖 暧 的 ， 无 须 报 


告 了 。 


2.2.2 ” 浮 点 型 


浮 点 型 由 整数 部 分 与 小 数 部 分 组 成 ， 也 可 以 使 用 科学 计数 法 表示 。 

比如 ， 小 萌 还 在 细 想 中 ， 老 板 突然 打 断 了 她 的 思维 ， 问 她 总 共 花 了 多 少 钱 。 小 萌 理 了 一 下 思 
绪 ， 每 瓶 水 3.3 元 ， 一 共 102 瓶 ， 总 共 多 少 钱 呢 ? 输入 如 下 : 

>>>- 323*302 

336.59999999999997 

结果 怎么 这 么 长 ?小 萌 看 傻 了 ， 不 过 冷静 一 看 ， 原 来 是 ， 整数 和 浮 点 数 在 计算 机 内 部 存储 的 
方式 不 同 ， 整 数 运算 永远 是 精确 的 ， 而 浮 点 数 运算 可 能 会 有 四 舍 五 入 的 误差 。 

“老板 ,一 共 336.6 元 ”。“ 好 的 ， 加 上 买 糖 的 钱 了 吗 ”? 小 萌 暗 吕 自 己 ， 瞧 我 这 脑筋 。 再 计 
算 一 次 ， 每 瓶 水 3.3 元 ， 一共 102 瓶 ， 再 加 上 一 包 糖 15.5 元 ， 输 入 如 下 : 
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>>> 3.3*102+15.5 
352.09999999999997 


这 结果 好 像 很 凌乱 ， 应 该 这 么 输入 : 


>>> 336.6+15.5 
352.1 


这 个 结果 就 好 看 多 了 。 报 告 给 老板 ， 一 共 花 费 352.1 元 。 
小 萌 又 开始 思考 了 ， 浮 点 数 相 乘 结 果 这 么 怪 ， 浮 点 数 的 除法 是 怎样 的 呢 ? 想到 了 就 实践 ， 输 
入 如 下 : 


>>> 153/51.0 
3.0 


这 个 结果 和 153 除 以 51 的 结果 是 一 样 的 ， 如 果 155 除 以 51.0 呢 ? 输入 如 下 : 


>>> 155/51.0 
3.0392156862745097 


结果 和 155 除 以 51 也 是 一 样 的 。 那 做 地 板 除 和 取 余 又 是 怎样 的 呢 ? 输入 如 下 : 


>>> 155//51.0 
3.0 

>>> 155%51.0 
2.0 


可 以 看 出 ， 得 到 的 结果 都 是 浮 点 型 的 。 


2.2.3 ”复数 


复数 由 实数 部 分 和 虚数 部 分 构成 ， 可 以 用 a + bj 或 complex(a,b) 表 示 ， 复 数 的 实 部 a 和 虚 部 
都 是 浮 点 型 。 

Python 支持 复数 ， 不 过 Python 的 复数 我 们 当前 阶段 使 用 或 接触 得 比较 少 ， 此 处 就 不 再 具体 讲 
解 ， 读 者 有 一 个 概念 即 可 ， 有 兴趣 可 以 自行 查阅 相关 资料 。 


2.2.4 数据 类 型 转换 


有 时 我 们 要 对 数据 内 置 的 类 型 进行 转换 ， 只 需要 将 数据 类 型 作为 函数 名 即 可 。 

数据 的 类 型 转换 时 有 如 下 4 个 函数 可 以 使 用 : 

int(x) 将 x 转换 为 一 个 整数 。 

float(x) 将 x 转换 为 一 个 浮 点 数 。 

complex(x) 将 x 转换 为 一 个 复数 ， 实 数 部 分 为 x*， 虚 数 部 分 为 0。 

complex(x, y) 将 x 和 y 转换 为 一 个 复数 ， 实 数 部 分 为 x, 虚数 部 分 为 y。 x 和 yy 是 数字 表达 式 。 


比如 ， 小 萌 去 购物 ， 计 算出 应 付 金额 是 352.1 元 ， 超 市 老板 为 免除 找 零 的 麻烦 ， 让 小 萌 支 付 
352 元 。Python 中 的 转换 可 以 执行 如 下 : 


>>> int(352.1) 
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5 
很 容易 就 得 到 了 转换 后 的 结果 。 但 是 金额 的 操作 必须 用 浮 点 数 进行 记 账 ， 这 个 容易 ， 用 float 
函数 就 行 了 。 输 入 如 下 : 


>>> float(352.1) 
352.1 


这 样 就 得 到 了 浮 点 型 数据 。 

结果 跟 输 入 的 一 样 ， 这 下 怎么 办 呢 ? 把 int 函数 放 入 float 函数 中 是 否 可 以 呢 ? 尝试 一 下 : 

>>> float(int(352.1)) 

352.0 

这 里 先 把 352.1 取 整 ， 得 到 整数 332， 再 用 float 将 352 转换 成 浮 点 数 352.0， 这 样 就 得 到 我 们 
需要 的 结果 了 。 虽 然 输 入 的 字符 看 起 来 有 点 复杂 ， 但 是 还 是 得 到 结果 了 。 

这 其 实 是 函数 的 嵌 套 ， 后 面 会 进行 具体 介绍 ， 此 处 做 相关 了 解 即 可 。 


2.2.5 ”常量 
所 请 常量 ， 就 是 不 能 改变 现 有 的 值 的 变量 ， 比 如 常用 的 数学 常数 就 是 一 个 常量 。 在 Python 


中 ， 通 常用 全 部 大 写 的 变量 名 表示 常量 。 
Python 中 有 两 个 比较 常见 的 常量 ， 即 PI 和 E。 
PI: 数学 常量 pi 〈 圆 周 率 ， 一 般 以 r 表 示 )。 
E: 数学 常量 e， 即 自然 对 数 。 


这 两 个 常量 将 会 在 后 续 章节 中 使 用 ， 具 体 的 用 法 在 使 用 中 体现 。 
3. 
2.3 ”变量 和 关键 字 


编程 语言 最 强大 的 功能 之 一 是 操纵 变量 。 变 量 (variable》 是 一 个 需要 熟知 的 概念 ， 如 果 你 觉 
得 数学 让 你 抓 狂 ， 别 担心 ，Python 中 的 变量 很 好 理解 。 变 量 基本 上 代表 某 个 值 的 名 字 。 


2.3.1 变量 


变量 指向 各 种 类 型 值 的 名 字 ， 以 后 再 用 到 这 个 值 时 ， 直 接 引 用 名 字 即 可 ， 不 用 再 写 具体 的 值 。 
在 Python 中 ， 变 量 的 使 用 环境 非常 宽松 ， 没 有 明显 的 变量 声明 ， 而 且 类 型 不 是 固定 的 。 你 可 以 把 
一 个 整数 赋值 给 变量 ， 如 果 觉 得 不 合适 ， 把 字符 串 赋 给 变量 也 可 以 。 

在 Python 中 ， 等 号 〈=) 是 赋值 语句 ， 可 以 把 任意 数据 类 型 赋值 给 变量 。 

如 果 要 定义 一 个 名 为 xiaohong 的 变量 ， 该 怎么 操作 呢 ? 输入 如 下 : 


>>> xiaohong='XiaoHong' 
区 二 
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此 操作 解释 : xiaohong 是 我 们 创建 的 变量 ，= 是 赋值 语句 ，XiaoHong 是 变量 值 ， 需 要 用 引号 
标记 。 整 句 话 的 意思 为 : 创建 变量 xiaohong 并 赋值 为 XiaoHong。 

小 萌 疑 惑 了 ， 怎 么 前 面 输入 后 按 回 车 键 就 能 输出 内 容 ， 这 里 怎么 跳 到 输入 提示 状态 呢 ? 别 急 ， 
还 记得 前 面 讲 的 print0) 吗 ? print() 是 输出 函数 ， 看 看 这 里 ， 没 有 使 用 输出 函数 ， 屏 幕 上 当然 不 会 输 
出 内 容 了 。 要 输出 内 容 应 该 怎么 操作 呢 ? 我 们 尝试 一 下 : 

>>> Print(xiaohong) 

XiaoHong 

不 错 ， 尝 试 成 功 了 。 但 为 什么 小 荫 输 入 的 是 print(xiaohong)， 结 果 却 输出 XiaoHong 呢 ? 这 就 
是 变量 的 好 处 ， 可 以 只 定义 一 个 变量 ， 比 如 xiaohong， 把 一 个 值 赋 给 这 个 变量 ， 比 如 XiaoHong， 
这 样 当 我 们 输出 xiaohong 时 ， 实 际 上 输出 的 是 XiaoHong。 

在 使 用 变量 前 需要 对 其 赋值 。 没 有 值 的 变量 是 没有 意义 的 ， 编 译 器 也 不 会 编译 通过 。 例 如 ， 
定义 一 个 变量 为 abc， 不 赋 任 何 值 ， 输 入 及 结果 如 下 : 

>>> abc 

Traceback (most recent call last) : 


File "<stdin>", line 1, in <module> 
NameError: name "abc' is not defined 


同一 个 变量 可 以 反复 赋值 ， 而 且 可 以 是 不 同类 型 的 变量 ， 输 入 如 下 : 
>>> a = 123 

>>> a 

123 

>>> a='RBC' 


>>> Print(a) 
ABC 


这 种 变量 本 身 类 型 不 固定 的 语言 称 为 动态 语言 ， 与 之 对 应 的 是 静态 语言 。 剖 
量 时 必须 指定 变量 类 型 ， 如 果 赋 值 时 类 型 不 匹配 就 会 报错 。 和 静态 语言 相 比 ， 动 态 语言 更 灵活 。 

当 不 能 确定 变量 或 数据 的 类 型 时 ， 可 以 借助 解释 器 内 置 的 函数 type 进行 确认 。 在 交互 模式 下 
输入 如 下 : 


>>> type('Hello,world!') 
<class 'str'> 


测试 得 到 输入 的 结果 类 型 是 字符 串 类 型 (str) 。 


>>> type (100) 
<class 'int'> 


测试 得 到 输入 的 结果 类 型 是 整 型 (int) 。 


>>> type(3.0) 
<class 'float'> 


测试 得 到 输入 的 结果 类 型 是 浮 点 型 (float) 。 
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测试 得 到 输入 的 结果 类 型 是 字符 串 类 型 (str) 。 


测试 得 到 输入 的 结果 类 型 是 整 型 (int) 。 





测试 得 到 输入 的 结果 类 型 是 浮 点 型 (float) 。 
只 要 是 用 双 引 号 或 单 引号 括 起 来 的 值 ， 都 属于 字符 串 。 在 交互 模式 下 输入 : 





测试 得 到 输入 的 结果 类 型 都 是 字符 串 类 型 (str) 。 
注意 不 要 把 赋值 语句 的 等 号 等 同 于 数学 中 的 等 号 。 比 如 下 面 的 代码 : 





小 萌 一 脸 疑 问 , a= a+ 200 是 什么 等 式 啊 ? 读书 时 不 知道 在 这 个 等 式 上 花费 了 多 少 脑 细胞 ， 可 
别 再 拿 这 个 骗 我 了 ,我 可 是 读 过 小 学 的 。 小 萌 啊 小 萌 ， 计 算 机 可 不 是 人 脑 ， 也 不 需要 遵循 学 校 的 知 
识 ， 计 算 机 有 计算 机 的 思考 方式 。 在 编程 语言 中 ， 赋 值 语句 先 计算 右 侧 的 表达 式 a + 200， 得 到 结 
果 300， 再 赋 给 变量 a。 由 于 a 之 前 的 值 是 100， 重 新 赋值 后 ，a 的 值 变 成 300。 我 们 通过 交互 模式 
验证 ， 输 入 如 下 : 


和 我 们 所 描述 的 结果 一 致 。 
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理解 变量 在 计算 机 内 存 中 的 表示 也 非常 重要 。 当 我 们 输入 如 下 : 


>>> a='RBC'" 
这 时 ，Python 解释 器 做 了 两 件 事情 : 


(1) 在 内 存 中 创建 了 一 个 'ABC' 字 符 串 。 
(2) 在 内 存 中 创建 了 一 个 名 为 a 的 变量 ， 并 把 它 指向 'ABC'。 


也 可 以 把 一 个 变量 a 赋值 给 另 一 个 变量 b, 这 个 操作 实际 上 是 把 变量 b 指向 变量 a 所 指向 的 数 
例如 下 面 的 代码 : 
>>> a='ABC' 
>>> b=a 
>>> a='XYZ' 
>>> Print(b) 
最 后 一 行 输出 变量 b 的 内 容 到 底 是 'ABC' 还 是 'XYZ' 呢 ?如 果 从 数学 意义 上 理解 , 就 会 错误 地 得 
出 b 和 a 相同 ， 应 该 是 XYZ'。 实 际 上 ，b 的 值 是 'ABC'。 我 们 一 行 一 行 地 执行 代码 ， 就 可 以 看 到 到 
底 发 生 了 什么 事 。 

执行 a='ABC'， 解 释 器 创建 了 字符 串 'ABC' 和 变量 a， 并 把 a 指向 ABC'， 如 图 2-3 所 示 。 





四 


str 
四 一“ "ABC" 
本 L 
图 2-3 a 指向 ABC' 


执行 b=a， 解 释 器 创建 了 变量 b， 并 把 b 指向 a 指向 的 字符 串 'ABC'， 如 图 2-4 所 示 。 


str 


"ABC" 
一 一 
/ 
bie 
图 24 a、b 指 向 ,ABC' 


执行 a = 'XYZ'， 解 释 器 创建 了 字符 串 'XYZ'， 并 把 a 的 指向 改 为 'XYZ'， 但 b 没有 更 改 ， 如 图 
2-5 所 示 。 
Str 
"ABC" 
a = 
b | str 
"XYZ" 
图 2-5 a 指向 XYZ', b 不 变 


最 后 输出 变量 b 的 结果 自然 是 ABC' 了 。 
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2.3.2 ”变量 名 称 


程序 常常 选择 有 意义 的 名 称 作为 变量 名 ， 以 此 标记 变量 的 用 途 。 

变量 名 是 由 数字 或 字符 组 成 的 任意 长 度 的 字符 串 ， 必 须 以 字母 开头 。 使 用 大 写字 母 是 合法 的 ， 
但 变量 名 建议 使 用 小 写字 母 开头 。Python 是 区 分 大 小 写 的 。 举 个 例子 来 说 ，Name 和 name 是 两 个 
不 同 的 变量 名 。 在 交互 模式 下 输入 如 下 : 

>>> name='study Python is happy' 

>>> Name='I agree with You' 

>>> print (name) 

study Python is happy 

>>> Print(Name) 

I agree with you 

下 画 线 “″ ”可 以 出 现在 变量 名 中 ， 经 常用 于 连接 多 个 词组 ， 如 happy_study、do it_ with_ 
more_practice。 在 交互 模式 下 输入 如 下 : 

>>> happy_study='stay hungry stay foolish' 

>>> print (happy_study) 

stay hungry stay foolish 


如 果 给 变量 取 非 法 的 名 称 ， 解 释 器 就 会 显示 语法 错误 。 请 看 下 面 的 示例 : 


>>> 2wrongtest='just for test' 
File "<stdin>", line 1 
2wrongtest='just for tes 


SyntaxError: invalid syntax 
该 示例 提示 语法 错误 ， 错 误 信 息 为 无 效 的 语法 ， 原 因为 不 是 以 字母 开头 的 。 
>>> xiaoming@me='surprised' 
File "<stdin>", line 1 
SyntaxError: can't assign to operator 
该 示例 提示 语法 错误 ， 错 误 信 息 为 不 能 做 指定 操作 ， 原 因 是 包含 一 个 非法 字符 @。 
Python 不 允许 使 用 关键 字 作 为 变量 名 ， 请 看 下 面 的 例子 : 
>>> from='from' 
File "<stdin>", line 1 


from="'from' 


SyntaxError: invalid syntax 


from 是 Python 的 一 个 关键 字 ， 因 此 出 现 错 误 。 
Python 3 中 共有 33 个 关键 字 ， 都 不 能 作为 变量 名 来 使 用 。 


False None True and as assert break 
class continue def del elif else except 
finally for from global if import in 
nonlocal lambda is not or pass raise 


return try while with yield 
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2.4 语 名 


语句 是 Python 解释 器 可 以 运行 的 一 个 代码 单元 ， 也 可 以 理解 为 可 以 执行 的 命令 。 我 们 目前 已 
经 使 用 了 两 种 语句 : print 打印 语句 和 赋值 语句 。 

赋值 语句 有 两 个 作用 : 一 是 建立 新 的 变量 ， 二 是 将 值 赋予 变量 。 任 何 变量 在 使 用 时 都 必须 赋 
值 ， 否 则 会 被 视 为 不 存在 的 变量 。 

看 了 上 百 字 ， 也 没 明白 什么 是 语句 ， 小 萌 暗 自 抱怨 道 。 于 是 她 随手 在 交互 模式 下 输入 如 下 : 


>>> advice='boss,we want have a lunch' 


刚 输 完 一 句 ， 小 萌 就 停 下 了 ， 等 等 ， 刚 才 输 入 的 不 就 是 语句 吗 ? 前 面 都 做 过 不 少 示 例 了 ， 看 
看 还 用 过 什么 语句 。 在 交互 模式 下 写 的 第 一 个 程序 不 就 是 print 语句 吗 ? 对 了 ， 还 可 以 知道 这 个 语 
名 中 advice 的 类 型 是 什么 样 的 。 小 萌 想 完 ， 在 交互 模式 下 输入 如 下 : 


>>> type (advice) 

<class 'str'> 

在 这 个 语句 中 ，advice 的 类 型 是 字符 串 〈str) 。 还 有 什么 类 型 的 赋值 语句 呢 ? 对 了 ， 前 面 还 学 
习 了 整 型 和 浮 点 型 ， 在 交互 模式 下 输入 : 

>>> money=99999999 

>>> type (money) 

<class ‘int'> 

>>> spend=1.11111111 


>>> type (spend) 
<class 'float'> 


不 错 ， 把 之 前 学 习 的 内 容 温习 了 一 下 。 于 是 小 萌 又 在 交互 模式 下 输入 如 下 : 


>>> so happy 
SyntaxError: invalid syntax 


哎呀 ， 怎 么 又 犯 糊 涂 了 ， 变 量 是 一 定 要 赋值 的 。 于 是 重新 输入 : 


>>> print('so happy,it is a perfect forenoon') 
so happy,it is a perfect forenoon 


小 萌 突 然 感觉 有 人 站 在 自己 旁边 ， 原 来 是 小 智 。 小 智 盯 着 交互 模式 输入 界面 ， 突 然 说 道 : “这 
个 用 状态 图 展示 会 更 直观 ”。 说 完 就 帮 小 萌 画 出 了 一 个 变量 状态 图 ， 如 图 2-6 所 示 。 





2-6 ”变量 的 状态 图 
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一 般 情况 下 ， 我 们 用 状态 图 表示 变量 的 状态 。 左 边 是 变量 名 称 ， 右 边 是 变量 值 。 状 态 图 显示 
了 赋值 语句 的 最 终 操作 结果 。 

原来 小 智 知 道 这 么 多 ， 小 萌 心 中 暗暗 高 兴起 来 ， 感 谢 小 智 的 指导 。 这 真是 一 个 愉快 的 上 午 
不 过 真 的 很 饿 。 好 像 到 服务 区 了 。 老 板 宣布 在 这 里 休息 一 下 ， 顺 便 补充 点 能 量 再 往 前 走 。 


t 





2.5 表 达 式 


表达 式 是 值 、 变 量 和 操作 符 的 组 合 。 单 独 一 个 值 可 以 看 作 表 达 式 ， 单 独 的 变量 也 可 以 看 作 表 
达 式 。 

这 个 怎么 理解 呢 ? 小 萌 不 解 地 看 着 这 么 短 短 一 条 语句 ， 脑 袋 怎 么 都 拐 不 过 弯 。“ 今 天 的 午餐 
真 不 错 ”， 原 来 是 小 智 ， 小 萌 突 然 来 了 精神 ， 可 以 向 小 智 请 教 啊 。 

“小 智 ， 中 午 好 ， 能 帮 有 我 看 看 这 个 怎么 理解 吗 ? ”小 智 过 去 看 了 看 ， 思 考 了 一 下 ， 给 小 萌 做 
了 如 下 讲解 。 

表达 式 和 语句 一 般 不 容易 区 分 ， 很 多 人 会 将 两 者 混在 一 起 。 那 么 语句 和 表达 式 之 间 有 什么 区 
别 呢 ? 

表达 式 是 某 事 ,语句 就 是 做 某 事 ， 也 就 是 告诉 计算 机 做 什么 。 比 如 3*3 是 9，print(3*3) 输 出 也 
是 9。 区 别 在 哪里 呢 ? 我 们 在 交互 模式 下 输入 如 下 : 

>>> 3*3 

9 

>>> print (3*3) 

9 

在 交互 模式 下 ， 结 果 都 是 一 样 的 。 这 是 因为 解释 器 总 是 输出 所 有 表达 式 的 值 〈 内 部 都 使 用 相 
同 的 函数 对 结果 进行 呈现 ， 后 面 会 有 详细 介绍 ) 。 一 般 情 况 下 ，Python 不 会 这 么 做 ， 毕 竟 3*3 这 
样 的 表达 式 不 能 做 什么 有 趣 的 事情 ， 而 编写 print(3*3) 会 有 一 个 显 式 的 输出 结果 9。 

语句 和 表达 式 之 间 的 区 别 在 赋值 时 表现 得 更 加 明显 。 因 为 语句 不 是 表达 式 ， 所 以 没有 值 可 供 
交互 式 解释 器 输出 。 比 如 在 交互 模式 下 输入 如 下 : 
>>> a=100 
>>> 
>>> 10*10 
100 
从 输入 结果 可 以 看 到 ， 赋 值 语句 输入 完成 后 ， 下 面 立 刻 出 现 了 新 的 提示 输入 符 。 表 达 式 输入 完成 
下 面 立刻 得 到 了 结果 。 不 过 对 于 赋值 语句 ， 有 些 东 西 已 经 变 了 ， 变 量 a 现在 绑 定 了 一 个 值 100。 
这 个 是 语句 特性 的 一 般 定 义 : 它们 改变 了 事物 。 比 如 ， 赋 值 语 名 改变 了 变量 ，print 语句 改变 
了 屏幕 显示 的 内 容 。 
赋值 语句 可 能 是 所 有 计算 机 程序 设计 语言 中 最 重要 的 语句 类 型 ， 尽 管 现在 还 难以 说 清 赋值 语句 的 
重要 性 。 变 量 就 像 临时 的 “存储 器 ”就 像 厨 房 中 的 锅 碗 靳 分 一 样 )》， 强 大 之 处 在 于 ， 在 操作 变量 时 
并 不 需要 知道 存储 了 什么 值 。 比 如 ， 即 使 不 知道 x 和 y 的 值 到 底 是 多 少 ， 也 会 知道 x*y 的 结果 就 是 x 
和 yy 的 乘积 。 所 以 ， 可 以 通过 多 种 方法 使 用 变量 ， 而 不 需要 知道 在 程序 运行 时 ， 最 终 存储 的 值 是 什么 。 





后 
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2.6 ”运算 符 和 操作 对 象 


运算 符 和 操作 对 象 是 计算 机 中 比较 常见 的 ， 所 有 计算 都 涉及 运算 符 和 操作 对 象 。 本 节 将 介绍 
Python 中 的 运算 符 和 操作 对 象 。 


2.6.1 什么 是 运算 符 和 操作 对 象 


运算 符 是 一 些 特殊 符号 的 集合 ， 我 们 前 面 学 习 的 加 (+) 、 减 (-)、 乘 (*) 、 除 (0/) 、 地 板 
除 (/) 、 取 余 〈%) 等 都 是 运算 符 。 操 作对 象 是 由 运算 符 连 接 起 来 的 对 象 。 加 、 减 、 乘 、 除 4 种 
运算 符 是 我 们 从 小 学 就 开始 接触 的 ， 不 过 乘除 的 写法 不 一 样 ， 这 个 要 记 住 。 小 萌 看 到 这 个 标题 后 快 
速 回忆 ， 这 个 学 习 方式 不 错 ， 不 但 能 温 故 知 新 ， 还 做 了 联想 记忆 和 纵向 比 对 ， 值 得 借鉴 。 

Python 支持 以 下 7 种 运算 符 : 

(1) 算术 运算 符 。 

(2) 比较 (关系 ) 运算 符 。 

(3) 赋值 运算 符 。 

(4) 逻辑 运算 符 。 

(5) 位 运算 符 。 

(6) 成 员 运 算 符 。 

(7) 身份 运算 符 。 

这 么 多 ， 看 来 今天 可 以 大 开眼 界 了 ， 小 萌 心 里 一 阵 狂喜 。 

接 下 来 让 我 们 一 个 一 个 学 习 吧 ! 














2.6.2 算术 运算 符 


表 2-1 为 算术 运算 符 的 描述 和 实例 。 假 设 变量 a 为 10， 变 量 b 为 5。 





























表 2-1 算术 运算 符 
运算 符 | 描述 实例 
丰 加 : 两 个 对 象 相 加 a+b 输 出 结果 为 15 
- 减 : 得 到 负数 或 一 个 数 减 去 另 一 个 数 a 一 b 输 出 结果 为 5 
* 乘 : 两 个 数 相 乘 或 返回 一 个 被 重复 若干 次 的 字符 串 ”| a* b 输出 结果 为 50 
/ 除 : x 除 以 y a/b 输 出 结果 为 2.0 
% 取 模 : 返回 除法 的 余数 a%b 输出 结果 为 0 
bee 寡 : 返回 x 的 y 次 圭 a##b 为 10 的 5 次 方 ， 输 出 结果 为 100000 
/1 取 整 除 〔 地 板 除 ) : 返回 商 的 整数 部 分 9//2 输出 结果 为 4，9.0/2.0 输出 结果 为 4.0 





下 面 进行 实战 。 在 交互 模式 下 输入 如 下 : 


| 
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>>> a=10 
>>> b=5 
>>> print(atb) 


15 


>>> print (a-b) 


5 


>>> print (a*b) 


50 


>>> print (a/b) 


2.0 


>>> print (a**b) 
100000 
>>> print (9//2) 


4 


>>> print (9.0//2.0) 


4.0 


此 处 的 加 、 减 、 乘 、 除 、 取 余 、 取 整除 前 面 都 已 经 做 过 详细 介绍 ， 较 好 理解 。 但 是 每 运算 与 
数学 中 学 习 的 乘 方 运算 的 形式 是 不 一 样 的 ， 在 数学 中 是 这 样 的 形式 ， 军 运算 的 形式 是 ax*2。 有 


没有 更 好 的 方式 让 人 更 容易 记 住 这 个 符号 呢 ? 


有 一 个 很 好 的 例子 ， 为 什么 会 出 现 32 位 和 64 位 操作 系统 ， 并 且 现 在 大 家 都 趋向 于 安装 64 位 


的 软件 ? 先 看 交互 模式 下 的 两 个 输入 : 


>>> 2**32/1024/1024/1024 


4.0 


>>> 2**64/1024/1024/1024 
17179869184.0 


第 一 个 输入 ，2**32 是 2 的 32 次 方 ， 这 是 32 位 操作 系统 最 大 支持 内 存 的 字 节 数 ， 除 以 第 一 个 
1024 是 转换 为 KB, 1KB=1024B, 除 以 第 二 个 1024 是 转换 为 MB, 1MB=1024KB, 除 以 第 三 个 1024 
是 转换 为 GB，1GB=1024MB。 这 个 结果 意味 着 32 位 操作 系统 最 大 只 能 支持 4GB 的 内 存 ， 现 在 手 
机 都 是 4GB 标 配 了 ， 计 算 机 4GB 怎么 够 用 呢 ? 所 以 大 家 都 趋向 于 选择 64 位 操作 系统 ，64 位 操作 


系统 能 支持 多 大 内 存 ， 大 家 可 以 自行 计算 一 下 。 





























2.6.3 ”比较 运算 符 
表 2-2 为 比较 运算 符 的 描述 和 实例 。 以 下 假设 变量 a 为 10、 变 量 b 为 20。 
表 2-2 ”比较 运算 符 

运算 符 | 描述 实例 

一 等 于 :比较 对 象 是 否 相等 (a 一 b 返回 False 
= 不 等 于 : 比较 两 个 对 象 是 否 不 相等 (al=b) 返回 True 
> 大 于 : 返回 x 是 否 大 于 y (a>b) 返回 False 
小 于 : 返回 x 是 否 小 于 y。 所 有 比较 运算 符 返回 1 表示 真 ， 返 回 0 表示 假 ， (a<b) 返回 Tme 

与 特殊 的 变量 True 和 False 等 价 。 注 意 大 写 的 变量 名 

> 大 于 等 于 : 返回 x 是 否 大 于 等 于 y (a>=b) 返回 False 
ee 小 于 等 于 : 返回 x 是 否 小 于 等 于 y (a<=b) 返回 Tme 
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下 面 进行 实战 。 
>>> a=10 
>>> b=20 
>>> a==b 
False 

>>> a!=b 
True 

>>> a>b 
False 

>>> a<b 
True 

>>> a>=b 
False 

>>> a<=b 
True 

>>> a+10>=b 
True 

>>> a+10>b 
False 

>>> a<=b-10 
True 

>>> a<b-10 
False 

>>> a==b-10 
True 


小 智 : 小 萌 ， 注 意 到 比较 运算 的 特色 了 吗 ? 
小 萌 : 比较 运算 只 返回 True 和 False 两 个 值 。 





小 智 : 对 的 ， 能 看 出 比较 运算 符 两 边 的 值 和 比较 的 结果 有 什么 特色 吗 ， 特 别 是 对 于 ==、<、>、 


、= 这 5 个 比较 运算 符 的 结果 ? 


小 萌 : 让 我 仔细 观察 观察 ， 对 于 这 些 比较 运算 ， 只 要 左边 和 右边 的 操作 数 满足 操作 符 的 条 件 ， 
结果 就 是 True， 不 满足 就 是 False。 
小 智 : 你 理解 的 没 错 , 其 实 可 以 通俗 地 理解 为 , 比较 结构 符合 大 家 的 心理 预期 , 结果 就 是 True， 
不 符合 结果 就 是 False。 比 如 上 面 的 例子 中 a<b， 即 10<20， 符 合 大 家 的 预期 ， 就 返回 True; 对 于 
a==b， 即 10==20， 大 家 一 眼 就 能 看 出 这 两 者 不 相等 ， 就 返回 False。 





在 一 些 地 方 ， 会 用 1 代表 True、0 代表 False， 这 是 正确 也 是 合理 的 表示 方式 。 大 家 可 以 理 


解 为 开 和 关 ， 就 像 我 们 在 物理 中 所 学 的 电源 的 打开 和 关闭 一 样 。 后面 会 有 更 多 地 方 用 1 和 0 
代表 True 和 False。 





另外 ， 在 Python 2 中 ， 有 时 会 看 到 <> 符 号。 和 上 = 一 样 ， 僵 也 表示 不 等 于 ， 在 Python 3 中 已 去 
除 该 符号 。 若 以 后 看 到 <> 运 算 符 ， 则 使 用 的 是 Python 2。 
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2.6.4 ”赋值 运算 符 


表 2-3 为 赋值 运算 符 的 描述 和 实例 。 假 设 变量 a 为 10， 变 量 b 为 20。 
































表 2-3 赋值 运算 符 

运算 符 描述 实例 
三 简单 的 赋值 运算 符 c=a+b， 将 a+b 的 运算 结果 赋值 给 c 
= 加 法 赋值 运算 符 c+=a， 等 效 于 c=c+a 
= 减法 赋值 运算 符 c-=a， 等 效 于 c=c-a 
二 乘法 赋值 运算 符 Cc*=a， 等 效 于 c=c*a 
I 除法 赋值 运算 符 c/=a， 等 效 于 c=c/a 
%= 取 模 赋值 运算 符 c%= a， 等 效 于 c=c%a 
4 罕 赋 值 运算 符 c*#=a， 等 效 于 c=c**a 
/ 乒 取 整 (地 板 〉 除 赋值 运算 符 c//=a， 等 效 于 c=c//a 

下 面 进 行 实战 。 

>>> a=10 

>>> b=20 

>>> c=0 

>>> C=a+b 

>>> Print(c) 

30 

>>> c+=10 

>>> Print(c) 

40 

>>> c-=a 


>>> Print(c) 
30 

>>> c*=a 
>>> Print(c) 
300 

>>> c/=a 
>>> Print(c) 
30.0 

>>> cg%=a 
>>> Print(c) 
0.0 

>>> c=a**5 
>>> Print(c) 
100000 

>>> c//=b 
>>> Print(b) 
20 

>>> print(c) 
5000 


第 2 章 开启 Python 之 旅 | 35 





26.5 


位 运算 符 


位 运算 符 是 把 数字 看 作 二 进 制 进行 计算 的 。 表 2-4 为 Python 中 位 运算 符 的 描述 和 实例 。 假 设 
变量 a 为 60， 变 量 b 为 13。 














表 2-4 位 运算 符 
运算 符 | 描述 实例 
C 按 位 与 运算 符 : 若 参与 运算 的 两 个 值 的 两 个 相应 位 都 为 1，| (a&b) 输出 结果 为 2， 二 进 制 解释 ; 
则 该 位 的 结果 为 1， 和 否则 为 0 0000 1100 
| 按 位 或 运算 符 : 只 要 对 应 的 两 个 二 进 制 位 有 一 个 为 1, 结果 | (a | b) 输出 结果 为 61， 二 进 制 解释 : 
位 就 为 1 0011 1101 
交 结 ,二 释 : 
^ 按 位 异 或 运算 符 ， 当 两 个 对 应 的 二 进 制 位 相 异 时， 结果 为 1 | 人 ee 果 为 495 二 壕 制 角 村 
本 按 位 取 反 运算 符 ， 对 数据 的 每 个 二 进 制 位 取 反 ， 即 把 1 变 | (~a ) 输出 结果 为 561， 二 进 制 解释 : 
为 0, 把 0 变 为 1 1100 0011 
本 左 移动 运算 符 : 运算 数 的 各 个 二 进 制 位 全 部 左 移 若 干 位 ， | a << 2 输出 结果 为 240， 二 进 制 解释 : 
由 << 右 边 的 数 指定 移动 的 位 数 ， 高 位 丢弃 ， 低 位 补 0 1111 0000 
Ee 右 移动 运算 符 : 把 >> 左 边 运算 数 的 各 个 二 进 制 位 全 部 右 移 | a >> 2 输出 结果 为 5， 二 进 制 解释 : 





若干 位 ，>> 右 边 的 运算 数 指定 移动 的 位 数 


下 面 进行 实战 。 
>>> a=60 


>>> b=13 
>>> c=0 


>>> c=agb 
>>> print(c) 


12 


>>> c=alb 
>>> Print(c) 


61 


>>> c=a^b 
>>> Print(c) 


49 


>>> c=~a 
>>> Print(c) 


=6E 


>>> c=a<<2 
>>> print(c) 


240 


>>> c=a>>2 
>>> print(c) 


15 





0000 1111 
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2.6.6 ”逻辑 运算 符 


Python 语言 支持 逻辑 运算 符 。 表 2-5 为 逻辑 运算 符 的 描述 和 实例 ， 假 设 变量 a 为 10， 变 量 b 
为 20。 




















表 2-5 逻辑 运算 符 

运算 符 ”| 逻辑 表达 式 | 描述 实例 

布尔 “与 ”: 如 果 x 为 False，x and y 就 返回 False; 否则 es 

20 

and xandy | 返回 ”的 计算 人 (aandb) 返回 

布尔 “或 ”: 如 果 x 不 等 于 0， 就 返回 x 的 值 ， 否则 返回 
or xory y 的 计算 值 (aorb) 返回 10 
本 ee 布尔 “ 非 ”: 如 果 x 为 True， 就 返回 False; 如 果 x 为 not(a and b) 返 回 False 


False， 就 返回 True 





下 面 进行 实战 。 
>>> a=10 


>>> b=20 
>>> a and b 


>>> not a 
False 

>>> not b 
False 

>>> not -1 
False 

>>> not False 
True 

>>> not True 


False 


2.6.7 成 员 运 算 符 


除了 之 前 介绍 的 运算 符 外 ，Python 还 支持 成 员 运算 符 ， 表 2-6 为 成 员 运 算 符 的 描述 和 实例 。 
表 2-6 成 员 运 算 符 
































运算 符 | 描述 实例 

g 如 果 在 指定 的 序列 中 找到 值 ， 就 返回 True; 否 二 

in 则 返回 False 如 果 x 在 y 序 列 中 ， 就 返回 True 
如 果 在 指定 的 序列 中 没有 找到 值 ， 就 返回 True; 区 

not in 否则 返回 False 如 果 x 不 在 y 序列 中 ， 就 返回 Tme 





下 面 进行 实战 。 


>>> a=10 
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>>> b=5 

>>> list=[1,2,3,4,5] 
>>> Print(a in list) 
False 

>>> Print(a not in list) 
True 

>>> Print(b in list) 
True 

>>> Print(b not in list) 
False 


你 可 能 会 疑惑 list 是 什么 ，list 是 一 个 集合 ， 此 处 不 做 具体 讲解 ， 后 面 章 节 会 有 详细 介绍 。 


2.6.8 身份 运算 符 


身份 运算 符 用 于 比较 两 个 对 象 的 存储 单元 ， 表 2-7 为 身份 运算 符 的 描述 和 实例 。 





表 2-7 身份 运算 符 
运算 符 | 描述 实例 
is is 判断 两 个 标识 符 是 否 引用 自 一 个 对 象 xis y， 如 果 id(x) 等 于 id(y)，is 返回 结果 1 





xis noty， 如 果 id(x) 不 等 于 id(y)，is not 就 返回 
结果 1 





is not isnot 用 于 判断 两 个 标识 符 是 否 引用 自 不 同 对 象 








下 面 进行 实战 。 

>>> a=10 

>>> b=10 

>>> Print(a is b) 
True 

>>> Print(a is not b) 
False 

>>> b=20 

>>> Print(a is b) 
False 

>>> Print(a is not b) 


True 





2.6.9 运算 符 优 先 级 


表 2-8 列 出 了 从 最 高 到 最 低 优先 级 的 所 有 运算 符 。 
表 2-8 运算 符 优先 级 
运算 符 描述 


指数 〈 最 高 优先 级 ) 
一 二、 一 按 位 翻转 、 一 元 加 号 和 减 号 (最 后 两 个 的 方法 名 为 +@ 和 -@) 
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( 续 表 ) 
运算 符 描述 
乘 、 除 、 取 模 和 取 整 除 
+、 一 加 法 、 减 法 
Sw 右 移 、 左 移 运 算 符 
& 位 与 
A | 位 运算 符 
比较 运算 符 
等 于 运算 符 
=%= 片 /三 二 +=**#= 赋值 运算 符 
isis not 身份 运算 符 
in notin 成 员 运算 符 
notorand 逻辑 运算 符 





一 个 表达 式 中 出 现 多 个 操作 符 时 ， 求 值 的 顺序 依赖 于 优先 级 规则 。Python 遵守 数学 操作 符 


的 传统 规则 。 


小 萌 ， 还 记得 数学 


唱 ， 有 括号 


有 更 多 操作 运算 符 ， 
(1) 插 号 (Parentheses,，P) 拥有 最 高 优先 级 ， 可 以 强制 表达 式 按照 需要 的 顺序 求 值 ， 


国光 作答 的 人 和 % 规 几 是 外 相国 9 
先 算 括号 里 的 ， 无 论 是 括号 里 还 是 括号 外 的 ， 都 是 先 乘除 、 
可 以 使 用 缩 略 词 PEMDAS 帮助 记忆 部 分 规则 。 


后 加 减 。 在 Python 中 


括号 中 


的 表达 式 会 优先 执行 ， 也 可 以 利用 括号 使 得 表达 式 更 加 易 读 。 


例如 ， 


对 于 


-个 表达 式 ， 想 要 执行 完 加 减 后 再 做 乘除 运算 ， 在 交互 模式 下 输入 如 下 : 


>>> a=20 

>>> b=15 

>>> c=10 

>>> d=5 

>>> e=0 

>>> e=(a-b) *c/d 

>>> print(' (a-b)*c/d='ve) 
(a-b)*c/d= 10.0 


顺利 达到 了 我 们 想 要 的 结果 ， 如 果 不 加 括号 会 怎样 呢 ? 


>>> e=a-b*c/d 
>>> print('a-b*c/d=',e) 
a-b*c/d= -10.0 


结果 与 前 面 完 全 不 同 了 ， 这 里 根据 先 乘除 后 加 减 进行 运算 。 如 果 表 达 式 比较 长 ， 


可 以 使 得 表达 式 更 易 读 。 


>>> e=atbtc-c*d 
>>> print('atbtc-c*d=',e) 
atbtc-c*d= -5 


以 上 输入 没有 加 括号 ， 表 达 式 本 身 没 有 问题 ， 但 看 起 来 不 太 直观 。 如 果 进 行 如 下 输入 


>>> e=(a+b+c) 一 (cx*d) 
>>> print(' (atbtc)-(c*d)="',e) 





加 上 括号 就 
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(at+b+c)-(c*d)= -5 


这 样 看 起 来 就 非常 直观 。 运 算 结果 还 是 一 样 的 ， 但 我 们 一 看 就 能 明白 该 表达 式 的 执行 顺序 是 


怎样 的 。 


(2) 乘 方 (Exponentiation，E) 操作 拥有 次 高 的 优先 级 ， 例 如 : 


>>> 2##142 
4 

> 2H 2) 
8 

bet de 
2 

er ht} 
16 

od 
64 


以 上 结果 解释 : 2 的 一 次 方 为 2， 加 2 后 结果 为 4; 1 加 2 等 于 3，2 的 3 次 方 结果 为 8; 2 的 2 


次 方 为 4, 4 乘 以 3 等 于 12; 2 的 3 次 方 为 8，2 乘 以 8 等 于 16; 2 乘 以 3 等 于 6,，2 的 6 次 方 为 64。 


(3) 乘法 (Multiplication，M) 和 除法 (Division，D) 优先 级 相同 ， 并 且 高 于 有 相同 优先 级 


的 加 法 〈Addition，A) 和 减法 〈Subtraction，S) ， 例 如 : 


>>> atb*c-d 
165 
>>> axb/c+d 
35.0 


(4) 优先 级 相同 的 操作 按照 自 左 向 右 的 顺序 求 值 (除了 乘 方 外 ) ， 例 如 : 
>>> atb-ctd 
30 
>>> atb-c-d 
20 


其 他 运算 符 的 优先 级 在 实际 使 用 时 可 以 自行 尝试 判断 。 若 通过 观察 判断 不 了 ， 则 可 以 在 交互 


模式 下 通过 实验 进行 判断 。 


符 


和 


2.7 字符 串 操 作 


字符 串 是 Python 中 最 常用 的 数据 类 型 。 我 们 可 以 使 用 引号 ("或 ") 创建 字符 串 。 
通常 字符 串 不 能 进行 数学 操作 ， 即 使 看 起 来 像 数 字 也 不 行 。 字 符 串 不 能 进行 除法 、 减 法 和 字 





E: 


之 间 的 乘法 运算 。 下 面 的 操作 都 是 非法 的 。 


>>> 'hello'/3 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: unsupported operand type(s) for /: 'str' and 'int' 
>>> "world'-1 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
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TypeError: unsupported operand type(s) for -: 'str' and 'int' 
>>> 'hello'*world 
Traceback (most recent call last) : 
File "<stdin>", line 1, in <module> 
NameError: name "world' is not defined 
>>> " hello'"-'world' 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: unsupported operand type(s) for -: "str' and "str'" 


字符 串 可 以 使 用 操作 符 +， 但 功能 和 数学 中 不 一 样 ， 它 会 进行 拼接 (concatenation) 操作 ， 即 





将 前 后 两 个 字符 首尾 连接 起 来 。 


例如 : 


>>> stringl='hello'" 

>>> string2='world' 

>>> print(stringl+string2) 
helloworld 


输出 的 字符 紧 紧 挨 着 ， 看 起 来 不 怎么 好 看 ， 能 不 能 在 两 个 单词 间 加 一 个 空格 呢 ? 
如 果 想 让 字符 串 之 间 有 空格 ， 就 可 以 建 一 个 空 字符 变量 插 在 相应 的 字符 串 之 间 ， 让 字符 串 隔 


开 ， 或 者 在 字符 串 中 加 入 相应 的 空格 。 在 交互 模式 下 输入 如 下 : 


>>> stringl='hello' 

>>> string2='world' 

>>> space=' ' 

>>> Print(stringl+space+string2) 
hello world 


或 者 
>>> stringl='hello' 
>>> string2=' world' 


>>> print(stringl+string2) 
hello world 


这 些 是 字符 串 的 一 些 简单 操作 ， 在 后 续 章 节 中 会 介绍 更 多 、 更 实用 的 字符 串 操作 。 
小 萌 ， 你 有 没有 发 现 进 行 了 这 么 多 操作 ， 操 作 中 都 没有 出 现 中 文 ， 这 是 怎么 回 事 呢 ? 
是 啊 ， 虽 说 一 直 用 英文 操作 ， 在 编码 时 可 以 学 习 英 文 ， 但 很 多 时 候 我 还 是 喜欢 用 中 文 表达 。 





我 们 目前 没有 操作 中 文 ， 是 因为 Python 不 支持 中 文 吗 ? 


Python 是 支持 中 文 的 。 正 如 我 们 前 面 所 说 的 ， 字 符 串 也 是 一 种 数据 类 型 ， 但 是 字符 串 特殊 的 


是 有 编码 问题 。 


因为 计算 机 上 只 能 处 理 数字 ， 其 实 只 认识 0 和 1， 即 二 进 制 。 如 果 要 处 理 文本 ， 就 必须 先 把 文本 


转换 为 数字 才能 处 理 。 最 时 的 计算 机 在 设计 时 采用 8 比特 (bit) 为 一 个 字 节 (byte) ， 所 以 一 个 字 
节 (8 位 ) 能 表示 的 最 大 整数 是 255 (二 进 制 11111111 等 于 十 进 制 255, 简单 表示 为 2**+8-1=255) 。 
如 果 要 表示 更 大 的 整数 ， 就 必须 用 更 多 字 节 。 比 如 两 个 字 节 (16 位 ) 可 以 表示 的 最 大 整数 是 65535 
(2**16-1) ，4 个 字 节 (32 位 ) 可 以 表示 的 最 大 整数 是 4294967295 (2**32-1) 。 





由 于 计算 机 是 美国 人 发 明 的 ， 因 此 最 早上 只 有 127 个 字母 被 编码 到 计算 机 里 ， 也 就 是 大 小 写 英 








文字 母 、 数 字 和 一 些 符号 ， 这 个 编码 表 被 称 为 ASCII 编码 。 例 如 ， 大 写字 母 A 的 编码 是 65， 小 写 
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字母 z 的 编码 是 122。 

要 处 理 中 文 ， 显 然 一 个 字 节 是 不 够 的 ， 至 少 需要 两 个 字 节 ， 而 且 不 能 和 ASCII 编码 冲突 ， 所 
以 中 国 制定 了 GB2312 编码 ， 用 来 把 中 文 编 进 去 。 

可 以 想象 ， 全 世界 有 上 百 种 语言 ， 日 本 把 日 文 编 到 Shift JIS 里 ， 韩 国 把 韩文 编 到 Euc-kr 里 ， 
各 国有 各 国 的 标准 , 就 不 可 避免 地 出 现 冲 突 。 结 果 就 是 , 在 多 语言 混合 的 文本 中 就 会 显示 乱码 。 当 
时 各 国 对 编码 问题 的 感觉 如 图 2-7 所 示 。 





2、 守 符 编码 的 问题 真是 令 人 头疼 ! 


My 
2-7 令 人 头疼 的 字符 编码 


Unicode 应 运 而 生 。Unicode 把 所 有 语言 都 统一 到 一 套 编码 里 ， 这 样 就 不 会 有 乱码 问题 了 。 

Unicode 标准 在 不 断 发 展 , 最 常用 的 是 用 两 个 字 节 表示 一 个 字符 (如 果 要 用 到 非常 生 个 的 字符 ， 
就 需要 4 个 字 节 ) 。 现 代 操作 系统 和 大 多 数 编程 语言 都 直接 支持 Unicode。 

下 面 我 们 来 看 ASCII 编码 和 Unicode 编码 的 区 别 : ASCII 编码 是 1 个 字 节 ,而 Unicode 编码 通 
常 是 两 个 字 节 。 

字母 A 用 ASCII 编码 是 十 进 制 的 65， 二 进 制 的 01000001。 

字符 0 用 ASCII 编码 是 十 进 制 的 48， 二 进 制 的 00110000。 注 意 字 符 0 和 整数 0 是 不 同 的 。 

汉字 “中 ?已 经 超出 了 ASCI 编 码 的 范围 ,用 Unicode 编码 是 十 进 制 的 20013, 二进制 的 01001110 
00101101。 

如 果 把 ASCII 编码 的 A 用 Unicode 编码 ， 只 需要 在 前 面 补 0 就 可 以 ， 因 此 A 的 Unicode 编码 
是 00000000 01000001 。 

新 的 问题 又 出 现 了 : 如 果 统 一 成 Unicode 编码 , 乱码 问题 从 此 消失 了 。 但 是 写 的 文本 基本 上 全 
部 是 英文 时 ， 用 Unicode 编码 比 ASCII 编码 多 一 倍 存储 空间 ， 在 存储 和 传输 上 十 分 不 划算 。 

本 着 节约 的 精神 ， 又 出 现 了 把 Unicode 编码 转化 为 “可 变 长 编码 ”的 UTF-8 编码 。UTF-8 编 
码 把 一 个 Unicode 字符 根据 不 同 的 数字 大 小 编码 成 1 一 6 个 字 节 ， 常 用 的 英文 字母 被 编码 成 1 个 字 
节 ， 汉 字 通 常 是 3 个 字 节 ， 只 有 很 生僻 的 字符 才 会 被 编码 成 4 一 6 个 字 节 。 如 果 你 要 传输 的 文本 包 
含 大 量 英 文字 符 ， 用 UTF-8 编码 就 能 节省 空间 ， 如 表 2-9 所 示 。 


表 2-9 各 种 编码 方式 比较 
字符 | ASCI[ Unicode UTF-8 


A | 01000001 00000000 01000001 01000001 
中 X 0100111000101101 11100100 10111000 10101101 


从 表 2-9 可 以 发 现 ，UTF-8 编码 有 一 个 额外 的 好 处 ， 就 是 ASCII 编码 实际 上 可 以 看 成 是 UTF-8 
编码 的 一 部 分 ， 所 以 只 支持 ASCII 编码 的 大 量 历史 遗留 软件 可 以 在 UTF-8 编码 下 继续 工作 。 
搞 清楚 ASCII、Unicode 和 UTF-8 的 关系 后 , 我 们 可 以 总 结 一 下 现在 计算 机 系统 通用 的 字符 编 
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码 工 作 方式 : 在 计算 机 内 存 中 ,统一 使 用 Unicode 编码 ， 当 需要 保存 到 硬盘 或 需要 传输 时 ， 可 以 转 
换 为 UTF-8 编码 。 

例如 ， 用 记事 本 编辑 时 ， 从 文件 读 取 的 UTF-8 字符 被 转换 为 Unicode 字符 到 内 存 ; 编辑 完成 
后 ， 保 存 时 再 把 Unicode 转换 为 UTF-8 保存 到 文件 ， 如 图 2-8 所 示 。 

浏览 网 页 时 ， 服 务 器 会 把 动态 生成 的 Unicode 内 容 转换 为 UTF-8 再 传输 到 浏览 器 ， 如 图 2-9 
所 示 。 


















































记事 本 服务 器 
Unicode 编 码 Unicode 编 码 | 
| 医 汪 
人 全 > 输出 UTF-8 网 页 
文件 : abc.txt + 
UTF-8 编 码 | | 浏览 器 | 
图 2-8 字符 转换 图 2-9 服务 器 、 浏 览 器 中 的 字符 串 转换 


我 们 经 常 看 到 很 多 网 页 的 源码 上 有 类 似 <meta charset="UTF-8" /> 的 信息 ， 表 示 该 网 页 用 的 是 
UTF-8 编码 。 

在 最 新 的 Python 3 版 本 中 ， 字 符 串 是 以 UTF-8 编码 的 。 也 就 是 说 ，Python 3 的 字符 串 支持 多 
语言 。 比 如 在 交互 模式 下 输入 : 

>>> print(' 你 好 ， 世 界 !') 

你 好 ， 世 界 ! 


>>> print(' 债 秋 ' ) 
馈 角 


可 以 看 到 ， 在 Python 3 中 ， 简 单 和 复杂 的 中 文字 符 都 可 以 正确 输出 。 


Python 2 中 默认 的 编码 格式 是 ASCII， 在 没 修 改编 码 格式 时 无 法 正确 输出 中 文 ， 在 读 取 中 文 
时 会 报错 。Python 2 使 用 中 文 的 语法 是 在 字符 串 前 面 加 上 前 缓 u。 





28 注 释 


当 程 序 变 得 更 大 、 更 复杂 时 ， 读 起 来 也 更 困难 。 程 序 的 各 部 分 之 间 紧 密 衔接 ， 想 依靠 部 分 代 
码 了 解 整个 程序 的 功能 很 困难 。 在 现实 中 , 我 们 经 常 很 难 弄 清楚 一 段 代码 在 做 什么 、 为 什么 那么 做 。 

因此 ， 在 程序 中 加 入 自然 语言 的 笔记 解释 程序 在 做 什么 是 一 个 不 错 的 主意 。 这 种 笔记 称 为 注 
释 (comments) ， 注 释 必 须 以 “# ”符号 开始 。 
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主要 


注释 可 以 单独 占 一 行 ， 也 可 以 放 在 语句 行 的 末尾 。 在 交互 模式 下 输入 如 下 : 
>>> # 打印 1+1 的 结果 

>>> print (1+1) 

2 

>>> print (1+1) # 打印 1+1 的 结果 

2 

从 符号 “#” 开 始 到 这 一 行 末 尾 ， 之 间 所 有 内 容 都 被 忽略 ， 这 部 分 对 程序 没有 影响 。 注 释 信息 
是 方便 程序 员工 作 , 一 个 新 来 的 程序 员 通 过 注释 信息 能 够 更 快 地 了 解 程序 的 功能 。 程序 员 在 经 
段 时 间 后 ， 可 能 对 自己 的 程序 不 了 解 了 ， 利 用 注释 信息 能 够 很 快 熟悉 起 来 。 

注释 最 重要 的 用 途 在 于 解释 代码 并 不 显而易见 的 特性 。 比 如 ， 在 以 下 代码 中 ， 注 释 与 代码 重 








复 ， 毫 无 用 处 。 


>>> r=10 ”# 将 10 赋值 给 
下 面 这 段 代 码 注释 包含 代码 中 隐藏 的 信息 ， 如 果 不 加 注释 ， 就 很 难 让 人 看 懂 是 什么 意思 〈 虽 


然 在 实际 中 可 以 根据 上 下 文 判定 ， 但 是 需要 浪费 不 必要 的 思考 时 间 ) 。 


>>> r=10 。 # 半 径 ， 单 位 是 米 
选择 好 的 变量 名 可 以 减少 注释 ， 但 长 名 字 会 让 复杂 表达 式 更 难 阅读 ， 所 以 这 两 者 之 间 需 要 权 


衡 取 售 。 


2.9 牛刀 小 试 一 一 九 九 乘法 表 实 现 


普 助 网 络 工具 ， 用 Python 实现 打印 九 九 乘法 表 。 


思考 点 拨 : 

从 简单 方向 思考 ， 要 做 九 九 乘法 表 的 实现 ， 需 要 使 用 到 如 下 知识 点 : 
(1) 数字 相 乘 。 

(2) 赋值 。 


(3) 打印 结果 。 





需要 使 用 到 后 续 章 节 的 内 容 ， 此 处 不 做 具体 介绍 。 


实现 代码 如 下 : 


>>> for i in range(1,10): 
for j in range (l,i+1): 
Print ("%d*%d=%2d" % (i,j,i*j),end=" ") 
print (™ ") 


在 交互 模式 下 执行 ， 得 到 输出 结果 如 下 : 


1*1]= 1 
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A 

3*1= 3 3*2= 6 3*3= 9 

4*1= 4 4*2= 8 4*3=12 4*4=16 

5*]lm 5 5*2=10 5*3=15 5*4=20 5*5=25 

6*1= 6 6*2=12 6*3=18 6*4=24 6*5=30 6*6=36 

T*1= 7 7*2=14 7*3=21 7*4=28 7*5=35 7*6=42 7*7=49 

8*1= 8 8*2=16 8*3=24 8*4=32 8*5=40 8*6=48 8*7=56 8*8=64 

9*lm 9 9*2=18 9*3=27 9*4=36 9*5=45 9*6=54 9*1=63 9*8=72 9*9m=81 


2.10 调 试 


这 里 通过 设置 一 些 错误 让 读者 认识 在 编写 代码 过 程 中 的 常见 问题 ， 以 帮助 读者 熟悉 和 解决 实 


际遇 到 的 问题 。 


(1) 还 记得 数字 类 型 转换 吗 ? 用 int0 转 换 一 个 字符 ， 会 得 到 怎样 的 结果 呢 ? 尝试 一 下 ， 在 交 


互 模式 下 输入 : 


对 于 


>>> int('hello') 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
ValueError: invalid literal for int() with base 10: 'hello' 
开动 大 脑 ， 思 考 一 下 这 段 语句 的 功能 。 

(2) 在 变量 和 关键 字 中 ， 若 变量 被 命名 为 关键 字 会 怎样 呢 ? 输入 如 下 
>>> class=' 你 好 ' 

File "<stdin>", line 1 

class=' 你 好 ' 


SyntaxError: invalid syntax 


(3) 在 算术 运算 符 中 ， 若 除数 为 0， 结 果 会 怎样 呢 ? 输入 如 下 


>>> 9/0 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

ZeroDivisionError: division by zero 


这 里 的 除数 跟 数学 中 的 一 样 ， 不 能 为 0。 
2.11 ”问题 解答 


(1) 关键 字 那 么 多 ， 我 需要 全 部 记 住 吗 ? 
答 : 可 以 不 用 刻意 记忆 ， 随 着 你 逐步 学 习 ， 会 碰 到 一 些 常用 关键 字 ， 见 多 了 自然 就 熟悉 了 。 





一 些 不 常用 的 , 见 到 了 再 回头 看 是 否 属于 关键 字 。 总 之 , 关键 字 可 以 在 学 习 和 使 用 中 慢 慢 记忆 。 
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(2) 这 么 多 运算 符 ， 都 需要 熟练 使 用 吗 ? 

答 : 能 熟练 使 用 当然 最 好 ， 若 不 能 全 部 熟练 使 用 ， 也 要 有 所 了 解 ， 在 实际 解决 问题 时 知道 应 
该 使 用 什么 运算 符 。 当 然 ， 也 可 以 碰 到 具体 问题 时 再 详细 研究 。 

(3) 字符 串 的 操作 只 有 本 章 介绍 的 这 些 吗 ? 

答 : 字符 串 还 有 很 多 操作 ， 本 章 介 绍 的 只 是 一 些 入 门 操作 ， 后 面 的 章节 会 详细 介绍 。 


2.12 温 故 知 新 ， 学 以 致 用 


章节 回顾 : 

(1) 回顾 数据 类 型 相关 的 概念 ， 如 整 型 、 浮 点 型 和 数据 类 型 转换 。 

(2) 回顾 变量 和 关键 字 相 关 的 概念 ， 并 尝试 记 住 这 些 关 键 字 。 

(3) 回顾 运算 符 和 操作 对 象 ， 并 通过 不 断 调试 熟悉 各 种 运算 符 。 

(4) 回顾 字符 串 的 操作 及 注释 ， 了 解 编码 方式 ， 尝 试 写 注释 。 

思考 并 解决 如 下 问题 : 

(1) 实现 数字 的 加 、 减 、 乘 、 除 、 地 板 除 等 操作 。 

(2) 自 定义 变量 ， 做 变量 的 赋值 和 值 的 变更 ， 并 查看 变量 类 型 。 

(3) 打印 一 条 语句 ， 让 它 尽 可 能 复杂 。 

(4) 通过 表达 式 实现 加 、 减 、 乘 、 除 、 地 板 除 等 操作 。 

(5) 结合 各 种 运算 符 ， 对 数字 进行 各 种 运算 符 的 操作 。 

(6) 结合 各 种 运算 符 ， 对 字符 串 进行 各 种 操作 。 

(7) 小 萌 和 小 智 约定 ， 明 天 小 智 送 一 颗 糖 给 小 萌 ， 并 从 后 天 起 ， 小 智 每 天 比 前 一 天 多 送 一 倍 
的 糖 给 小 萌 ， 到 第 16 天 〈 包 含 这 天 ) ， 小 萌 一 共 可 以 收 到 多 少 颗 糖 ? 

(8) 用 4 个 2 与 各 种 运算 符 进行 运算 ， 得 到 的 最 大 数 是 多 少 ? 

(9) 结合 本 章 所 学 ， 并 查阅 相关 资料 ， 看 看 下 面 的 代码 输出 结果 是 什么 ， 并 对 结果 进行 解释 。 

>>> habit=' Python 是 一 门 很 有 用 的 编程 语言 \n 我 想 学 好 它 " 

>>> Print (habit) 

# 你 认为 的 结果 是 

>>> len (habit) 

# 你 认为 的 结果 是 

(10) 自己 设计 一 个 语句 ， 使 该 语句 中 既 有 数字 的 加 减 乘除 等 操作 ， 也 包含 运算 符 的 操作 ， 
还 有 字符 串 的 操作 。 
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第 3 章 


列表 和 元 组 


本 章 将 引入 一 个 新 概念 一 一 数据 结构 。 数 据 结构 是 通过 某 种 方式 (如 对 元 素 进 行 编 号 ) 组 织 
在 一 起 的 数据 元 素 的 集合 ， 这 些 元 素 可 以 是 数字 或 字符 。 在 Python 中 ， 最 基本 的 数据 结构 是 序列 
(Sequence) 。Python 包含 6 种 内 建 序 列 ， 即 列表 、 元 组 、 字 符 串 、Unicode 字符 串 、buffer 对 象 
和 xrange 对 象 。 本 章 重 点 讨论 最 常用 的 两 种 ， 即 列表 和 元 组 。 


3.1 通用 序列 操作 


在 讲解 列表 和 元 组 之 前 ， 本 节 先 介绍 Python 中 序列 的 通用 操作 ， 这 些 操 作 在 列表 和 元 组 中 都 
会 用 到 。 

Python 中 所 有 序列 都 可 以 进行 一 些 特定 操作 ， 包 括 索 引 (indexing) 、 分 片 〈slicing) 、 序 列 
相 加 (adding) 、 乘 法 multiplying) 、 成 员 资格 、 长 度 、 最 小 值 和 最 大 值 。 


3 水 1 索引 


序列 是 Python 中 最 基本 的 数据 结构 。 序 列 中 的 每 个 元 素 都 分 配 一 个 数字 ， 代 表 它 在 序列 中 的 
位 置 (索引 ) ， 第 一 个 索引 是 0， 第 二 个 索引 是 1， 以 此 类 推 。 

序列 中 所 有 元 素 都 是 有 编号 的 ， 从 0 开始 递增 。 可 以 通过 编号 分 别 对 序列 的 元 素 进行 访问 。 
下 面 通 过 交互 输入 的 方式 介绍 一 个 通过 编号 取 元 素 的 例子 。 

>>> greeting='Hel1lo'# 定 义 变量 greeting， 并 赋值 Hello 

>>> greeting[0] # 根 据 编号 取 元 素 ， 使 用 格式 为 : 在 中 括号 中 输入 所 取 元 素 的 编号 值 

,ay 


>>> greeting[1] 
"en 


48 | Python 3.7 从 零 开始 学 





>>> greeting[2] 

‘1 

可 以 看 到 ， 序 列 中 的 元 素 从 0 开始 ， 从 左 向 右 依 自然 顺序 编号 ， 元 素 可 以 通过 编号 访问 。 获 取 元 
素 的 方式 为 : 在 变量 后 加 中 括号 ， 在 中 括号 中 输入 所 取 元 素 的 编号 值 。 这 个 格式 需要 记 住 。 

类 似 于 我 们 平时 排队 ， 站 成 一 排 时 ， 一 般 从 左 往 右 编号 ， 编 上 序号 后 一 般 从 1 开始 编号 ， 
不 会 从 0 开始 ) ， 当 叫 一 个 序号 时 ， 就 会 由 序号 对 应 到 人 。 程 序 中 的 序列 也 是 如 此 。 

这 里 的 编号 就 是 索引 ， 可 以 通过 索引 获取 元 素 。 所 有 序列 都 可 以 通过 这 种 方式 进行 索引 。 








字符 串 是 由 字符 组 成 的 序列 。 索 引 0 指向 第 一 个 元 素 。 比 如 在 上 面 的 示例 中 ， 索 引 0 指向 
字母 H， 索 引 1 指向 字母 e， 索 引 2 指向 字母 1。 





上 面 的 示例 是 从 左 往 右 通过 编号 获取 元 素 的 ， 是 否 可 以 从 右 往 左 通过 编号 获取 元 素 呢 ? 我 们 
试 一 试 ， 在 交互 模式 下 输入 : 

>>> greeting[-1] 

or 

>>> greeting[-2] 

‘1 

>>> greeting[-3] 

0 

>>> greeting[-4] 

vev 


可 以 看 到 ，Python 的 序列 也 可 以 从 右 开始 索引 ， 最 右边 的 元 素 索 引 值 为 -1， 从 右 向 左 递减 。 
在 Python 中 ， 从 左 向 右 索 引 称 为 正 数 索引 ， 从 右 向 左 索引 称 为 负数 索引 。 使 用 负数 索引 时 ， 
Python 会 从 最 后 一 个 元 素 开始 计数 。 最 后 一 个 元 素 的 位 置 编号 是 -1。 


最 后 一 个 元 素 的 编号 不 是 -0， 跟 数学 中 的 概念 一 样 : -0=0，-0 和 0 都 指向 第 一 个 元 素 。 





从 上 面 的 几 个 示例 可 以 看 到 ， 进 行 字 符 串 的 索引 时 都 定义 了 一 个 变量 ， 其 实 不 定义 变量 也 可 
以 。 下 面 来 看 一 个 例子 ， 在 交互 模式 下 输入 : 
>>> 'Hello' [0] 


>>> 'Hello' [1] 


>>> 'Hello' [-1] 

2 "Hello' [-2] 

1 

可 以 看 到 ， 直 接 使 用 索引 ， 不 定义 变量 进行 引用 也 可 以 。 直 接 使 用 索引 的 效果 和 定义 变量 的 
效果 是 一 样 的 。 

如 果 函 数 返 回 一 个 序列 ， 是 否 可 以 直接 对 结果 进行 索引 操作 呢 ? 在 交互 模式 下 输入 : 


>>> thirdth=input() [0] 





第 3 章 列表 和 元 组 | 49 





happy 

>>> thirdth 

hy 

由 输出 结果 可 以 看 到 ， 直 接 对 函数 的 返回 结果 进行 了 索引 操作 。 

索引 既 可 以 对 变量 的 引用 操作 ， 也 可 以 直接 操作 序列 ， 还 可 以 操作 函数 的 返回 序列 。 





3.1.2 分 片 


索引 用 来 对 单个 元 素 进行 访问 ， 使 用 分 片 可 以 对 一 定 范围 内 的 元 素 进 行 访问 ， 分 片 通过 冒号 


相隔 的 两 个 索引 实现 。 在 交互 模式 下 输入 : 


>>> number=[1,2,3,4,5,6,7,8,9,10] 
>>> number[1:3]  。 # 取 索引 为 第 一 和 第 二 的 元 素 
[2, 3] 


>>> number[-3:-1] # 负 数 表 明 从 右 开始 计数 ， 取 得 倒数 第 三 和 倒数 第 二 的 元 素 
[8, 9] 


由 操作 结果 可 以 看 到 ， 分 片 操作 既 支 持 正 数 索引 ， 也 支持 负数 索引 ， 并 且 对 于 提取 序列 的 一 


部 分 很 方便 。 


分 片 操作 的 实现 需要 提供 两 个 索引 作为 边界 ， 第 一 个 索引 的 元 素 包含 在 分 片 内 ， 第 二 个 索引 


的 元 素 不 包含 在 分 片 内 。 像 数学 里 的 a 和 xx<b，x 是 我 们 需要 得 到 的 元 素 ，a 是 分 片 操作 中 的 第 一 
个 索引 ，b 是 第 二 个 索引 ，b 不 包含 在 x 的 范围 内 。 


对 于 上 面 的 示例 ， 假 设 需要 访问 最 后 3 个 元 素 ， 使 用 正 数 索 引 可 以 这 样 操作 : 
>>> number=[1,2,3,4,5,6,7,8,9,10] 


>>> number [7:10] # 取 最 后 3 个 元 素 
[8, 9, 10] 


由 以 上 输入 和 我 们 前 面 对 序列 的 定义 可 以 得 出 ，number 的 编号 最 大 应 该 为 9， 编号 为 10 指向 


的 是 第 11 个 元 素 ， 是 一 个 不 存在 的 元 素 ， 但 是 由 于 在 最 后 一 个 元 素 之 后 ， 因 此 能 得 到 最 后 一 个 元 
素 。 这 么 做 没 问题 。 如 果 需 要 从 列表 的 结尾 开始 ， 即 使 用 负数 索引 ， 怎 么 办 呢 ? 我 们 尝试 看 看 ， 输 
入 如 下 : 


>>> number=[1,2,3,4,5,6,7,8,9,10] 

>>> number[-3:-1] 

[8, 9] 

结果 没有 输出 最 后 一 个 元 素 。 再 试 试 使 用 索引 0 作为 最 后 一 个 元 素 的 下 一 个 元 素 ， 输 入 如 下 : 


>>> number [-3:0] 
[] 


这 个 输出 结果 有 点 奇怪 ， 竞 然 一 个 数值 都 没有 。 
事实 上 ， 只 要 在 分 片 中 最 左边 的 索引 比 它 右边 的 索引 晚 出 现在 序列 中 ， 结 果 就 是 一 个 空 序列 。 


比如 上 例 中 ，-3 代表 倒数 第 3 个 元 素 ，0 代表 第 一 个 元 素 ， 倒 数 第 3 个 元 素 比 第 一 个 元 素 晚 出 现 ， 
即 排 在 第 一 个 元 素 后 面 ， 所 以 得 到 的 结果 是 空 序列 。 


我 们 怎么 通过 负数 索引 的 方式 取得 最 后 一 个 元 素 呢 ? 这 里 有 一 个 捷径 可 以 使 用 。 如 果 需 要 取 


得 的 分 片 包括 序列 结尾 的 元 素 ， 只 需 将 第 二 个 索引 设置 为 空 即 可 。 输 入 如 下 : 
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>>> number[-3:] 

[8, 9, 10] 

输出 结果 和 我 们 预期 的 一 样 。 

正 数 索引 能 否 使 用 这 种 方式 呢 ? 输入 如 下 : 

>>> number [0:] # 从 第 一 个 元 素 开始 输出 ， 输 出 全 部 结果 

[1，2，3，4，5，6，7，8，9，10] 

>>> number [ :0] # 最 后 一 个 元 素 为 第 一 个 ， 输 出 为 空 

A number[:3] # 取 得 前 3 个 元 素 

[1, 2, 3] 

由 输出 结果 可 以 知道 也 适用 于 正 数 索引 。 

根据 上 述 输 出 结果 可 知 ， 若 需要 输出 整个 序列 ， 则 可 以 将 两 个 索引 都 设置 为 定 。 输 入 如 下 : 

>>> number[:] # 取 得 整个 数组 

[1，2，3，4，5，6，7，8，9，10] 

输出 结果 是 整个 序列 。 

进行 分 片 时 ， 分 片 的 开始 点 和 结束 点 都 需要 指定 (无 论 是 直接 指定 还 是 间接 指定 ) ， 用 这 种 
方式 取 连 续 的 元 素 没有 问题 , 但 若 要 取 序 列 中 不 连续 的 元 素 就 比较 麻烦 , 或 者 直接 不 能 操作 。 比 如 
要 取 序 列 number 中 的 所 有 奇数 ， 以 一 个 序列 展示 出 来 ， 用 前 面 的 方法 就 不 能 实现 了 。 

对 于 上 面 这 种 情况 ，Python 为 我 们 提供 了 另 一 个 参数 步 长 (step length) ， 该 参数 通常 是 
隐 式 设置 的 。 在 普通 分 片 中 ， 步 长 是 1。 分 片 操作 就 是 按照 这 个 步 长 逐个 遍历 序列 的 元 素 ， 遍 历 后 
返回 开始 点 和 结束 点 之 间 的 所 有 元 素 。 也 可 以 理解 为 默认 步 长 是 1， 即 没有 设置 步 长 时 ， 步 长 隐 式 
设置 值 为 1。 输入 如 下 : 

>>> number [0:10:1] 

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 

由 上 面 的 示例 可 以 看 到 ， 分 片 包含 另 一 个 数字 。 这 种 方式 就 是 步 长 的 显 式 设置 。 看 起 来 和 隐 
式 设 置 步 长 没什么 区 别 , 得 到 的 结果 也 和 之 前 一 样 。 但 若 将 步 长 设置 为 比 1 大 的 数 ,结果 会 怎样 呢 ? 
输入 如 下 : 


>>> number [0:10:2] 
| 








由 上 面 的 输出 结果 可 以 看 到 ， 对 于 number 序列 ， 设 置 步 长 为 2 时 ， 得 到 的 结果 就 是 我 们 前 面 
想 要 的 奇数 序列 。 

由 结果 可 知 ， 步 长 设置 为 大 于 1 的 数 时 ， 会 得 到 一 个 跳 过 某 些 元 素 的 序列 。 例 如 ， 我 们 上 面 
设置 的 步 长 为 2， 得 到 的 序列 是 从 开始 到 结束 每 隔 1 个 元 素 的 序列 。 比 如 还 可 以 这 样 使 用 : 


>>> number[0:10:3] 
[1，4，7，10] 

>>> number[2:6:3] 
[3，6] 

>>> number[2:5:3] 
[3] 

>>> number [1:5:3] 
[2, 5] 


第 3 章 列表 和 元 组 | 51 





由 以 上 输出 结果 可 以 看 到 ， 使 用 步 长 的 方式 还 是 很 灵活 的 。 
除了 上 面 的 使 用 方式 外 ， 设 置 前 面 两 个 索引 为 空 的 捷径 也 可 以 使 用 。 操 作 如 下 : 


>>> number [::3] 
[1, 4, 7, 10] 


上 面 的 操作 将 序列 中 每 3 个 元 素 的 第 一 个 提取 出 来 , 前 面 两 个 索引 都 设置 为 空 。 步 长 设置 为 0 
是 否 可 行 呢 ? 输入 如 下 : 


>>> number[::0] 

Traceback (most recent call last) : 
File "<stdin>", line 1, in <module> 

ValueError: slice step cannot be zero 


输出 结果 告诉 我 们 步 长 不 能 为 0。 
步 长 是 否 可 以 为 负数 呢 ? 输入 如 下 : 


>>> number [10:0:-2] 

[10, 8, 6, 4, 2] 

>>> number [0:10:-2] 

[] 

>>> number[::-2] 

[10, 8, 6, 4, 2] 

>>> number[5::-2] 

[6, 4, 2] 

>>> number[:5:-2] 

[10, 8] 

>>> number[::-1] 

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1] 
>>> number[10:0:-1] # 第 二 个 索引 为 0， 取 不 到 序列 中 的 第 一 个 元 素 
[| 


>>> number [10::-1] # 设 置 第 二 个 索引 为 空 ， 可 以 取 到 序列 的 第 一 个 元 素 
[10，9，8，7，6，5，4，3，2，1] 

>>> number [2::-1] # 设 置 第 二 个 索引 为 空 ， 可 以 取 到 序列 的 第 一 个 元 素 

[3, 2, 1] 

>>> number[2:0:-1] # 第 二 个 索引 为 0， 取 不 到 序列 中 的 第 一 个 元 素 

[3, 2] 


上 面 的 输出 结果 好 像 不 太 好 理解 ， 使 用 负数 步 长 时 的 结果 怎么 跟 使 用 正 数 步 长 的 结果 相反 
呢 ? 这 就 是 正 数 步 长 和 负数 步 长 的 不 同 。 

对 于 正 数 步 长 ，Python 会 从 序列 的 头 部 开始 向 右 提 取 元 素 ， 直 到 最 后 一 个 元 素 ， 对 于 负数 步 
长 ， 则 是 从 序列 的 尾部 开始 向 左 提取 元 素 ， 直 到 第 一 个 元 素 。 正 数 步 长 必须 让 开始 点 小 于 结束 点 ， 
而 负数 步 长 必须 让 开始 点 大 于 结束 点 。 


通过 示例 可 以 看 到 ， 使 用 负数 步 长 时 ， 设 置 第 二 个 索引 为 空 才能 取 到 序列 的 第 一 个 元 素 。 





3.1.3 ”序列 相 加 


使 用 加 号 可 以 进行 序列 的 连接 操作 ， 输 入 如 下 : 
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>>> [1,2,3]+[4,5,6] 
[1，2，3，4，5，6] 
>>> a=[1,2] 

>>> b=[5,6] 

>>> at+b 

[1, 2, 5, 6] 

>>> s='hello,' 

>>> w='world' 

>>> stw 

"hello, world’ 


由 上 面 的 输出 结果 可 以 看 到 ， 数 字 序 列 可 以 和 数字 序列 通过 加 号 连接 ， 连 接 后 的 结果 还 是 数 
字 序 列 ; 字符 串 序 列 也 可 以 通过 加 号 连接 ,连接 后 的 结果 还 是 字符 串 序 列 。 数 字 序列 是 否 可 以 和 字 
符 串 序列 相 加 ， 结 果 是 数字 序列 还 是 字符 串 序 列 呢 ? 输入 如 下 : 

>>> [1,2]+'hello' 

Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
TypeError: can only concatenate list (not "str") to list 





>>> type ([1,2]) # 取 得 [1, 2] 的 类 型 为 ]ist 
<class 'list'> 
>>> type('hello') # 取 得 hello 的 类 型 为 字符 串 


<class 'str'> 

由 上 面 的 输出 结果 可 以 看 到 ， 数 字 序 列 和 字符 串 序列 不 能 通过 加 号 连接 。 错 误 提示 的 信息 是 : 
只 能 列表 和 列表 相连 。 

由 试验 结果 可 以 得 知 : 只 有 类 型 相同 的 序列 才能 通过 加 号 进行 序列 连接 操作 ， 不 同类 型 的 序 
列 不 能 通过 加 号 进行 序列 连接 操作 。 


3.1.4 乘法 


注意 此 处 的 乘法 并 不 是 数学 中 定义 的 乘法 。 

用 一 个 数字 x 乘 以 一 个 序列 会 生成 新 的 序列 。 在 新 的 序列 中 ， 原 来 的 序列 将 被 重复 x 次 ， 这 
就 是 序列 中 的 乘法 。 在 交互 模式 下 输入 : 

>>> 'hello'*5 

"hellohellohe1llohellohello'" 

>>> [7]*10 

| tr De a Se Ny (ee ay RR | 

从 输出 结果 看 到 ， 序 列 被 重复 了 对 应 的 次 数 ， 而 不 是 做 了 数学 中 的 乘法 运算 。 

在 Python 中 ， 序 列 的 乘法 有 什么 特殊 之 处 呢 ? 

如 果 要 创建 一 个 重复 序列 ， 就 可 以 像 上 面 的 示例 一 样 乘 以 一 个 想 要 得 到 的 序列 长 度 的 数字 ， 
这 样 可 以 快速 得 到 需要 的 列表 ， 非 常 方便 。 

空 列 表 可 以 简单 通过 两 个 中 括号 〈[]) 表示 ， 表 示 里 面 什么 东西 都 没有 。 如 果 想 创建 一 个 占用 
10 个 或 更 多 元 素 的 空间 ， 却 不 包括 任何 有 用 内 容 的 列表 ， 该 怎么 办 呢 ? 我 们 可 以 像 上 面 的 示例 一 
样 乘 以 10 或 对 应 的 数字 ， 得 到 需要 的 空 列表 ， 也 很 方便 。 

如 果 要 初始 化 一 个 长 度 为 x 的 序列 ， 就 需要 让 每 个 编码 位 置 上 都 是 空 值 ， 此 时 需要 一 个 值 代 
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表 空 值 ， 即 里 面 没有 任何 元 素 ， 可 以 使 用 None。None 是 Python 的 内 建 值 ， 确 切 含义 是 “这 里 什 
么 也 没有 ”。 例 如 ， 输 入 如 下 : 


从 示例 我 们 可 以 看 到 ，Python 中 的 序列 乘法 可 以 帮助 我 们 快速 做 一 些 初始 化 操作 。 序 列 乘法 
做 一 些 重复 操作 、 空 列表 和 None 初始 化 操作 还 是 挺 方便 的 。 


3.1.5 ”成员 资格 


为 了 检查 一 个 值 是 否 在 序列 中 ，Python 为 我 们 提供 了 in 运算 符 。in 运算 符 和 前 面 讨论 过 的 运 
算 符 有 些 不 同 。in 运算 符 用 于 检验 某 个 条 件 是 否 为 真 ， 并 返回 检验 结果 ， 检 验 结果 为 真 返回 True， 
为 假 返回 False。 这 种 运算 符 称 作 布 尔 运算 符 ， 返 回 的 真 值 叫 作 布尔 值 。 关 于 布尔 运算 符 的 更 多 内 
容 会 在 后 续 章 节 中 进行 介绍 。 

下 面 我 们 尝试 使 用 in 在 交互 模式 下 输入 : 
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TypeError: "in <string>' requires string as left operand, not int 


由 上 面 的 输出 结果 可 以 看 到 ， 使 用 in 可 以 很 好 地 检测 字符 或 数字 是 否 在 对 应 的 列表 中 。 并 且 
可 以 看 出 ， 数 字 类 型 不 能 在 字符 串 类 型 中 通过 in 进行 成 员 资格 检测 ， 而 字符 串 类 型 可 以 在 数字 列 
表 中 通过 in 进行 成 员 资格 检测 。 


3.1.6 长度、 最 小 值 和 最 大 值 


Python 为 我 们 提供 了 长 度 、 最 大 值 和 最 小 值 的 内 建 函 数 ， 对 应 的 内 建 函 数 分 别 为 len、max 和 
min。 

这 3 个 函数 该 怎么 使 用 呢 ? 在 交互 模式 下 输入 : 

>>> numbers=[300,200,100,800,500] 

>>> len (numbers) 

5 

>>> max (numbers) 

800 

>>> min (numbers) 

100 

>>> max (5,3,10,7) 

10 

>>> min(7,0,3,-1) 

< 工 

由 上 面 的 结果 可 以 看 到 ，len 函数 返回 序列 中 所 包含 元 素 的 数量 ，max 函数 和 min 函数 分 别 返 
引 序列 中 最 大 和 最 小 的 元 素 。 在 该 示例 中 ， 前 面 几 个 函数 的 输入 参数 都 是 序列 ， 可 以 使 用 前 面 的 解 
释 理解 。max 函数 和 min 函数 的 参数 不 是 一 个 序列 ， 而 是 以 多 个 数字 直接 作为 参数 ， 此 处 直接 求 
取 多 个 数字 的 最 大 值 和 最 小 值 。 


回 





3.2 列表 


前 面 已 经 用 了 很 多 次 列表 ， 可 以 看 出 列表 的 功能 是 比较 强大 的 。 本 节 将 讨论 列表 不 同 于 元 组 
和 字符 串 的 地 方 : 列表 的 内 容 是 可 变 的 〈mutable) 。 列 表 有 很 多 比较 好 用 、 比 较 独特 的 方法 ， 本 
节 将 一 一 进行 介绍 。 





3.2.1 更 新 列表 


我 们 在 3.1 节 中 所 讲述 的 有 关 序 列 的 操作 ， 如 索引 、 分 片 、 相 加 、 乘 法 等 都 适用 于 列表 。 本 节 
将 介绍 一 些 序列 中 没有 而 列表 中 有 的 方法 , 这 些 方法 的 作用 都 是 更 新 列表 , 有 元 素 赋值 、 增 加 元 素 、 
删除 元 素 、 分 片 赋值 等 。 下 面 逐 一 进行 介绍 。 
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1. 元 素 赋值 

我 们 前 面 学 习 过 赋值 语句 ， 赋 值 语 句 是 最 简单 的 改变 列表 的 方式 ， 如 a=2 就 属于 一 种 改变 列 
表 的 方式 。 这 里 我 们 将 通过 编号 标记 某 个 特定 位 置 的 元 素 , 并 对 该 位 置 的 元 素 重新 赋值 ,如 a[1]=10。 
在 交互 模式 下 输入 如 下 : 

>>> a=[1,2,3,2,1] 

>>> a[1]=10 

>>> a 

0 3 

>>> a[3]=10 

>>> a 

ek (kD 

还 记得 我 们 的 编号 是 从 0 开始 吧 ! 

从 上 面 的 输出 结果 可 以 得 知 ， 我 们 可 以 根据 编号 对 列表 中 某 个 元 素 重新 赋值 。 既 然 可 以 重新 
赋值 ， 是 否 可 以 赋 不 同类 型 的 值 呢 ?我 们 尝试 一 下 ， 输 入 如 下 : 

>>> a[2]='hello' # 对 编号 为 2 的 元 素 赋值 ， 赋 一 个 字符 串 

[ 入 'hello', 10, 1] 

>>> type (a) 


<class 'list'> 

>>> type (a[1]) # 别 忘 了 查看 类 型 函数 的 使 用 

<class 'int'> 

>>> type(a[2]) 

<class 'str'> 

由 上 面 的 输出 结果 可 以 得 知 ， 可 以 对 一 个 列表 中 的 元 素 赋 不 同类 型 的 值 。 比 如 上 面 的 示例 ， 
列表 a 中 既 有 int 类 型 的 值 ， 也 有 str 类 型 的 值 。 

假如 对 列表 赋值 时 使 用 的 编号 超过 了 列表 中 的 最 大 编号 ， 是 否 还 可 以 赋值 呢 ? 我 们 尝试 一 下 ， 
输入 如 下 : 

>>> tring=[1,2,3] 

>>> tring[3]='test' 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 








IndexError: list assignment index out of range 


在 上 面 的 示例 中 ,tring 的 最 大 编号 是 2， 当 给 编号 为 3 的 元 素 赋值 时 就 会 出 错 。 由 此 得 知 : 不 
能 为 一 个 不 存在 元 素 的 位 置 赋值 。 如 果 一 定 要 赋值 , 前面 学 习 的 序列 通用 操作 中 的 乘法 可 以 帮助 我 
们 ， 输 入 如 下 : 

>>> tring=[None]*5 

>>> tring[3]='test' 

>>> tring 

[None, None, None, 'test', None] 


由 以 上 输出 结果 可 以 得 知 ， 可 以 对 初始 化 过 的 位 置 进行 赋值 。 
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2. 增加 元 素 

由 元 素 赋值 的 示例 可 以 看 到 ， 不 能 为 一 个 不 存在 的 位 置 赋值 。 一 旦 初始 化 了 一 个 列表 ， 就 不 
能 再 往 这 个 列表 中 增加 元 素 了 。 若 需要 往 列表 中 增加 元 素 , 则 需要 将 整个 列表 中 的 元 素 都 复制 一 遍 ， 
再 添加 需要 增加 的 元 素 。Python 中 是 否 提供 对 应 的 方法 帮助 我 们 做 这 件 事情 呢 ? 答案 是 肯定 的 。 
输入 如 下 : 

>>> tring=[1,2,3] 

>>> tring.append (4) 

>>> tring 

[1, 2, 3, 4] 

由 示例 看 到 ， 可 以 使 用 append0 方 法 解决 前 面 的 困惑 。append0 方 法 是 一 个 用 于 在 列表 末尾 添 
加 新 对 象 的 方法 。 该 方法 的 语法 如 下 : 


list.append(obj) 
此 语法 中 list 代表 列表 ，obj 代表 需要 添加 到 list 列表 末尾 的 对 象 。 


提 ” 示 
append 的 使 用 方式 是 list.append(obj)。 


由 前 面 的 输出 结果 得 知 : append() 方 法 不 是 简单 地 返回 一 个 修改 过 的 新 列表 ， 而 是 直接 修改 原 
来 的 列表 。 下 面 展示 几 个 append() 的 示例 : 


>>> tring=[1,2,3] 

>>> tring.append('test') # 添 加 字符 串 
>>> tring 

[1, 2, 3, 'test'] 

S53 dma 

>>> s.append(3) # 添 加 数字 

>>> s 

| | 


由 上 面 的 示例 可 以 得 知 ， 可 以 往 数 字 序 列 中 添加 字符 串 ， 也 可 以 往 字符 串 序列 中 添加 数字 。 
3. 删除 元 素 
前 面 学 习 了 往 列 表 中 增加 元 素 ， 是 否 可 以 在 列表 中 删除 元 素 呢 ?例如 下 面 的 示例 : 


>>> tringa[l "a "Dc Ad "a"] 
>>> len (tring) 

5 

>>> del tring[1] 

>>> Print (" 删 除 第 二 个 元 素 : ' ,tring) 
删除 第 二 个 元 素 : ['a'，'c'，'d',，'e'] 
>>> Len (tring) 

4 


由 上 面 的 示例 看 到 , 可 以 使 用 del 删除 列表 中 的 元 素 。 上面 的 示例 使 用 del 删除 了 tring 列表 中 
的 第 二 个 元 素 ， 删除 元 素 后 ， 原 来 有 5 个 元 素 的 列表 变 成 只 有 4 个 元 素 的 列表 了 。 使 用 del 除了 可 
以 删除 列表 中 的 字符 外 ， 也 可 以 删除 列表 中 的 数字 ， 输 入 如 下 : 
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>>> num=[1,2,3] 

>>> len (num) 

3 

>>> del num[2] 

>>> Print (' 删 除 第 3 个 元 素 后 :', num) 
删除 第 3 个 元 素 后 : [1，2] 

>>> len (num) 

区 


上 面 的 输出 结果 已 经 从 数字 列表 中 删除 了 对 应 的 数字 。 
除了 删除 列表 中 的 元 素 外 ，del 还 能 用 于 删除 其 他 元 素 ， 具 体 在 后 续 章节 会 做 详细 介绍 。 
4. 分 片 赋值 

分 片 赋值 是 列表 一 个 强大 的 特性 。 先 看 下 面 的 示例 : 
>>> 1ist (' 女 排 夺冠 了 ') 

[a ts a A | 

>>> boil=1ist (' 女 排 夺 冠 了 ') 

>>> boil 

[Be sh dd Mi Rd | 

>>> show=list ('hi,boy') 

>>> show 

| 3 St eh et et | 

>>> show[3:]=list('man') 

>>> show 

[i Oh PP, .CS 


由 上 述 示例 可 以 看 出 ， 可 以 通过 分 片 赋值 直接 对 列表 进行 变更 。 示 例 中 我 们 通过 分 片 操作 变 


更 了 编号 3 之 后 位 置 的 元 素 ， 即 将 boy 替换 为 man 了 。 


上 述 示 例 中 引入 了 一 个 新 函数 一 一 list0 函 数 。list() 函 数 可 以 直接 将 字符 串 转换 为 列表 。 该 函数 


的 一 个 功能 就 是 根据 字符 串 创建 列表 ， 有 时 这 么 操作 会 很 方便 。list0 函 数 不 仅 适用 于 字符 串 ， 所 有 
类 型 的 序列 它 都 适用 。 


除了 上 面 展示 的 功能 ， 分 片 赋值 还 有 什么 强大 的 功能 呢 ? 先 看 下 面 的 示例 : 


>>> greeting=list('hi') 

>>> greeting 

th', Ao] 

>>> greeting[1:]=list ('ello') 
>>> greeting 

LD so ae ln orl 


我 们 分 析 一 下 ， 前 面 给 greeting 赋 的 值 是 [h, 让， 后 面 通 过 分 片 赋值 操作 将 编号 1 之 后 的 元 素 


变更 了 ,即将 编号 1 位 置 的 元 素 替换 为 e 了 , 但 是 编号 2 之 后 没有 元 素 ， 怎 么 能 操作 成 功 呢 ? 并 且 
一 直 操作 到 编号 为 4 的 位 置 ， 这 怎么 可 以 ? 


这 就 是 分 片 赋值 另 一 个 强大 的 功能 ， 可 以 使 用 与 原 序列 不 等 长 的 序列 将 分 片 替换 。 
还 有 没有 其 他 功能 呢 ? 请 看 下 面 的 示例 : 

>>> field=list('ae') 

>>> field 

Ly 

>>> field [1:1]=list('bcd') 

>>> field 
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a 

>>> boil=1ist (' 女 排 夺 冠 了 ') 

>>> boil 

a ,ee pa | 

>>> poil[2:2]=1ist ('2016 年 奥运 会 ') 

>>> boil 

a .A RS EL EL RL PL EA EE UP PR RI 


从 上 面 的 示例 可 以 看 出 ， 可 以 在 不 替换 任何 原 有 元 素 的 情况 下 在 任意 位 置 插入 新 元 素 。 读 者 


可 自行 尝试 在 上 面 示例 的 其 他 位 置 进行 操作 。 


当然 ， 上 面 的 示例 程序 只 是 “替换 ”了 一 个 空 分 片 ， 实 际 操作 是 插入 一 个 序列 。 
通过 该 示例 是 否 想起 了 前 面 的 append() 方 法 , 不 过 分 片 赋值 比 append() 方 法 强大 多 了 , append() 


方法 只 能 在 列表 尾部 增加 元 素 ， 而 分 片 赋值 可 以 在 任意 位 置 增加 元 素 。 


的 


六 


看 到 这 里 ， 是 否 同时 想起 了 前 面 删 除 元 素 的 操作 ， 分 片 赋值 是 否 支持 类 似 删除 的 功能 呢 ? 是 
支持 类 似 删除 的 功能 。 下 面 我 们 证 实 一 下 这 个 猜想 。 


>>> field=list ('abcde') 

>>> field 

A to eh 

>>> field[1:4]=[] 

>>> field 

| 

>>> boil=1ist (' 女 排 2016 年 奥运 会 夺冠 了 ') 
>>> boil 

中 六" ， 排 "，'21，101， I，161，' 年 '，' 奥 '，' 运 '，' 会 '，' 夺 '，' 筠 '，' 了 "'] 
>>> boil[2:10]=[] 

>>> boil 

[ ,| 

>>> del field[1:4] 

>>> field 

CU 


从 上 面 的 示例 可 以 看 到 ， 使 用 了 前 面 插 入 操作 的 逆 操 作证 实 我 们 的 猜想 。 删 除 和 插入 一 样 ， 


可 以 对 一 个 序列 中 任意 位 置 的 元 素 进行 删除 。 


所 以 通过 分 片 赋值 删除 元 素 也 是 可 行 的 , 并 且 分 片 赋值 删除 的 功能 和 del 删除 的 操作 结果 是 一 


样 的 。 


3.2.2” 藤 套 列表 


前 面 介绍 的 都 是 单 层 的 列表 ， 列 表 是 否 可 以 嵌 套 呢 ? 我 们 做 如 下 尝试 : 


>>> field=['a','b','c'] 

>>> field 

| | 

>>> num=[1,2,3] 

>>> num 

[1, 2, 3] 

>>> mix=[field,num] 

>>> mix 

[Il'a', 'b', 'c'], [1, 2, 3]] 
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>>> mix[0] 
| i | 
>>> mix[1] 
Livy 2 3 


由 上 面 的 操作 结果 得 知 ， 在 列表 中 可 以 嵌 套 列表 ， 赃 套 的 列表 取出 后 还 是 列表 。 


3.2.3 ”列表 方法 


之 前 的 章节 介绍 了 函数 ， 本 节 介绍 一 个 与 函数 密切 相关 的 概念 一 一 方法 。 

方法 是 与 对 象 有 紧密 联系 的 函数 ， 对 象 可 能 是 列表 、 数 字 ， 也 可 能 是 字符 串 或 其 他 类 型 的 对 
象 。 方 法 的 调用 方式 前 面 有 一 个 示例 ， 调 用 语法 如 下 : 

对 象 .方法 (参数 ) 

由 上 面 的 语法 和 前 面 append() 方 法 的 示例 可 知 : 方法 的 定义 方式 是 将 对 象 放 到 方法 名 之 前 ,两 
者 之 间 用 一 个 点 号 隔 开 ,， 方法 后 面 的 括号 中 可 以 根据 需要 带 上 参数 。 除 了 语法 上 有 一 些 不 同 外 , 方 
法 调用 和 函数 调用 很 相似 。 

列表 中 有 count、index、sort 等 比较 常用 的 方法 ， 下 面 逐 一 进行 介绍 。 


1. append 

该 方法 前 面 已 经 介绍 过 ， 功 能 是 在 列表 的 末尾 添加 新 对 象 。 
使 用 方式 为 : 

list.append (obj) 

2. count 

count() 方 法 用 于 统计 某 个 元 素 在 列表 中 出 现 的 次 数 。 
count() 方 法 的 语法 如 下 : 


list.count(obj) 


此 语法 中 ，list 代表 列表 ，obj 代表 列表 中 统计 的 对 象 。 


使 用 该 方法 的 示例 如 下 : 

>>> field=1list('hello,world') 

>>> field 

站 本条 

>>> print (' 列 表 field 中 ,字母 o 的 个 数 : '，, field.count ('0')) # 统 计 列表 中 的 字符 个 数 


列表 field 中 ,字母 o 的 个 数 : 2 

>>> print(' 列 表 field 中 ,字母 1 的 个 数 : field.count ('1')) 
列表 field 中 ,字母 1 的 个 数 : 3 

>>> Print (" 列 表 field 中 ,字母 a 的 个 数 : ', field.count ('a')) 
列表 field 中 ,字母 a 的 个 数 : 0 

>>> listobj = [123, 'hello', 'world', 123] 

>>> listobj = [26, 'hello', 'world', 26] 

>>> print(' 数 字 26 的 个 数 : ' ,1istobj .count (26)) 

数字 26 的 个 数 ， 2 

>>> print('hello 的 个 数 :' ,1istobj .count ('hello'))# 统 计 字 符 串 个 数 
hello 的 个 数 : 1 
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2 a ro daoonnti a 

3 

>>> mix=[[1,3],5,6, [1,3],2,] 

>>> print (" 顽 套 列表 mix 中 列表 [1, 3] 的 个 数 为 : ' ,mix.count ([1,3])) 
贬 套 列表 mix 中 列表 [1, 3] 的 个 数 为 : 2 


3. extend 


extend() 方 法 用 于 在 列表 未 尾 一 次 性 追加 另 一 个 序列 中 的 多 个 值 〈 用 新 列表 扩展 原来 的 列表 ) 。 
extend() 方 法 的 语法 如 下 : 


list.extend(seq) 


此 语法 中 ，list 代表 被 扩展 的 列表 ，seq 代表 需要 追加 到 list 中 的 元 素 列表 。 

使 用 该 方法 的 示例 如 下 : 

>>> a=['hello', 'world'] 

>>> b=['python', 'is','funny'] 

>>> a.extend(b) 

>>> a 

['hello', ‘'world', 'python', 'is', 'funny'] 

以 上 操作 结果 看 起 来 很 像 连接 操作 。extend() 方 法 和 序列 相 加 有 什么 区 别 呢 ? 我 们 先 看 看 下 面 
的 示例 : 

>>> a=['hello'v'world'] 

>>> b=['python', 'is','funny'] 

>>> atb 

['hello', ‘'world', 'python', 'is', 'funny'] 

>>> a 

['hello', ‘'world'] 

从 输出 的 结果 可 以 看 出 , 两 个 示例 中 a 和 的 赋值 是 一 样 的 , 但 第 一 个 示例 中 输出 a 的 值 和 第 
二 个 示例 中 输出 a 的 值 不 一 样 。 

由 此 我 们 得 出 ，extend() 方 法 和 序列 相 加 的 主要 区 别 是 : extend() 方 法 修改 了 被 扩展 的 序列 ， 如 
前 面 的 a， 原始 的 连接 操作 会 返回 一 个 全 新 的 列表 ， 如 上 面 的 示例 ， 返 回 的 是 一 个 包含 a 和 b 副本 
的 新 列表 ， 而 不 会 修改 原始 的 变量 。 

当然 ， 上 述 示例 也 可 以 用 前 面 学 习 的 分 片 赋值 实现 相同 的 结果 ， 输 入 如 下 : 

>>> a=['hello', 'world'] 

>>> b=['python', 'is','funny'] 

>>> a[len(a):]=b 

>>> a 

['hello', ‘world', 'python', 'is', 'funny'] 

可 以 看 到 ， 输 出 结果 和 使 用 extend() 方 法 一 样 ， 不 过 看 起 来 没有 extend() 方 法 易 懂 ， 因 此 不 会 
选择 这 个 方案 。 

4. index 


index() 方 法 用 于 从 列表 中 找 出 某 个 值 第 一 个 匹配 项 的 索引 位 置 。 
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index() 方 法 的 语法 如 下 : 
list.index(obj) 


此 语法 中 ，list 代表 列表 ，obj 代表 查找 的 对 象 。 

使 用 该 方法 的 示例 如 下 : 

>>> field=['hello', 'world', 'python', ‘is', 'funny'] 

>>> print('hello 的 索引 位 置 为 : '， field.index('hello')) 

hello 的 索引 位 置 为 。 0 

>>> print('python 的 索引 位 置 为 : ', field.index ('python')) 

Python 的 索引 位 置 为 : 2 

>>> Print ('abc 的 索引 位 置 为 : ', field.index('abc')) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

ValueError: 'abc' is not in list 

由 上 面 的 示例 看 到 ， 搜 索 单词 hello， 会 发 现 它 在 索引 号 为 0 的 位 置 ， 搜 索 单词 python， 它 在 
索引 号 为 2 的 位 置 ,索引 得 到 的 位 置 跟 元 素 在 序列 中 的 位 置 一 样 。 如 果 搜 索 列表 中 不 存在 的 字符 串 ， 
操作 结果 就 会 出 错 ， 所 以 对 于 不 在 列表 中 的 元 素 ， 用 index() 方 法 操作 时 会 报错 。 

5. insert 

insert() 方 法 用 于 将 对 象 插入 列表 。 

insert() 方 法 的 语法 如 下 : 


list.insert(index,obj) 


此 语法 中 ，list 代表 列表 ，index 代表 对 象 obj 需要 插入 的 索引 位 置 ，obj 代表 要 插入 列表 中 的 
对 象 。 

使 用 该 方法 的 示例 如 下 : 

>>> num=[1,2,3] 

>>> print(' 插 入 之 前 的 num: ' ,num) 

插入 之 前 的 num: [1，2，3] 

>>> num. insert (2, ' 插 入 位 置 在 2 之 后 ，3 之 前 ') 

>>> print(' 插 入 之 后 的 num: ' ,num) 

插入 之 后 的 num: [1，2， "插入 位 置 在 2 之 后 ，3 之 前 '，3] 


由 上 面 的 示例 看 到 ，insert() 方 法 操作 挺 方 便 的 。 

与 extend() 方 法 一 样 ，insert() 方 法 的 操作 也 可 以 使 用 我 们 前 面 学 习 的 分 片 赋值 实现 。 
>>> num=[1,2,3] 

>>> Print (" 插 入 之 前 的 num: ' ,num) 

插入 之 前 的 num: [1，2，3] 

>>> num[2:2]=[' 插 入 位 置 在 2 之 后 ，3 之 前 '] 

>>> print(' 插 入 之 后 的 num: ' ,num) 

插入 之 后 的 num: [1，2， "插入 位 置 在 2 之 后 ，3 之 前 '，3] 


输出 结果 和 insert 操作 的 结果 一 样 ， 但 看 起 来 没有 使 用 insert 容易 理解 ， 应 该 不 会 选择 这 个 方案 。 
6. pop 
pop() 方 法 用 于 移 除 列表 中 的 一 个 元 素 〈 默 认 最 后 一 个 元 素 ) ， 并 且 返 回 该 元 素 的 值 。 
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pop0 方 法 的 语法 如 下 : 
list.pop(obj=list[-1]) 


此 语法 中 ，list 代表 列表 ，obj 为 可 选择 的 参数 ， 代 表 要 移 除 列表 元 素 的 对 象 。 
使 用 该 方法 的 示例 如 下 : 


>>> field=['hello', 'world', 'python', ‘is', "funny'] 
>>> field.pop () # 不 传 参 数 ， 默 认 移 除 最 后 一 个 元 素 

"funny'" 

>>> print (' 移 除 元 素 后 的 field: ', field) 

移 除 元 素 后 的 field: ['hello'，,'world', 'python', 'is'] 
>>> field.pop (3) # 移 除 编号 为 3 的 元 素 

a 

>>> Print (' 移 除 元 素 后 的 field: ', field) 

移 除 元 素 后 的 field: 【'hello'，'world'，'python'] 

>>> field.pop (0) 

'hello' 

>>> print (' 移 除 元 素 后 的 field: ', field) 

移 除 元 素 后 的 field: ['world'，'python'] 


由 上 面 的 示例 看 到 ， 调 用 pop 方法 移 除 元 素 时 ， 在 交互 模式 下 会 告知 我 们 移 除 了 哪个 元 素 ， 
如 上 面 示例 中 的 funny、is。 移 除 funny 时 未 传 参数 ， 默 认 移 除 最 后 一 个 ; is 的 移 除 则 是 根据 传 入 的 
编号 3 进行 的 。 





栈 。 





使 用 pop 方法 可 以 实现 一 种 常见 的 数据 结构 

栈 的 原理 就 像 堆放 盘子 一 样 ， 一 次 操作 一 个 盘子 ， 要 将 若干 盘子 堆 成 一 堆 ， 只 能 在 一 个 盘子 的 
上 面 放 男 一 个 盘子 ， 要 拿 盘子 时 ， 只 能 从 顶部 一 个 一 个 往 下 拿 ， 最 后 放 入 的 盘子 是 最 先 被 拿 的 。 栈 
也 是 这 样 ， 最 后 放 入 栈 的 最 先 被 移 除 ， 称 为 LIFO (Last In First Out) ， 即 后 进 先 出 。 


栈 中 的 放 入 和 移 除 操作 有 统一 的 称谓 一 一 入 栈 (push) 和 出 栈 (pop) 。Python 没有 入 栈 方法 ， 
但 可 以 使 用 append 方法 代替 。pop 方法 和 append 方法 的 操作 结果 恰好 相反 ， 如 果 入 栈 〈 或 追加 ) 
刚刚 出 栈 的 值 ， 最 后 得 到 的 结果 就 不 会 变 ， 例 如 以 下 操作 : 

>>> num=[1,2,3] 

>>> num.append (num.pop () ) # 追 加 默认 出 栈 的 值 


>>> Print ('"num 追 加 默认 出 栈 值 的 操作 结果 : ' ,num) 
num 追加 默认 出 栈 值 的 操作 结果 : [1，2，3] 


由 上 面 的 操作 结果 看 到 ， 通 过 追加 默认 出 栈 的 值得 到 的 列表 和 原来 是 一 样 的 。 





7. remove 
remove() 方 法 用 于 移 除 列表 中 某 个 值 的 第 一 个 匹配 项 。 
remove() 方 法 的 语法 如 下 : 


list.remove(obj) 


此 语法 中 ，list 代表 列表 ，obj 为 列表 中 要 移 除 的 对 象 。 
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使 用 该 方法 的 示例 如 下 : 


>>> fielg=[' 女 排 ',' 精 神 ',' 中 国 ', ' 精 神 ', ' 学 习 ',' 精 神 '] 
>>> print (' 移 除 前 列表 field: '，, field) 
移 除 前 列表 field: 【[' 女 排 '，' 精 神 '，' 中 国 '，' 精 神 ' ，' 学习 '，' 精 神 '] 
>>> field.remove (' 精 神 ') 
>>> print(' 移 除 后 列表 field: ', field) 
移 除 后 列表 field: 【[' 女 排 '，' 中 国 '，' 精 神 '，' 学 习 ' ，' 精神 '] 
>>> field.remove ('abc') # 删 除 列表 中 不 存在 的 元 素 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ValueError: list.remove(x): x not in list 


由 上 面 的 输出 结果 看 到 ， 只 有 第 一 次 出 现 的 值 被 移 除 了 ， 第 二 次 之 后 出 现 的 值 没 有 被 移 除 。 
上 面 的 列表 中 有 3 个 “精神 ”， 调 用 移 除 方法 后 ， 删 除了 第 一 个 ， 后 面 两 个 仍然 存在 。 

同时 ， 操 作 移 除 列表 中 不 存在 的 值 是 不 行 的 ， 系 统 会 告知 移 除 的 对 象 不 在 列表 中 。 

有 一 点 需要 了 解 的 是 : remove 没有 返回 值 ， 是 一 个 直接 对 元 素 所 在 位 置 变更 的 方法 ， 它 修改 
了 列表 却 没 有 返回 值 ， 与 pop 方法 正好 相反 。 

8. reverse 

reverse() 方 法 用 于 反 向 列表 中 的 元 素 。 

reverse() 方 法 的 语法 如 下 : 














list.reverse() 

此 语法 中 ，list 代表 列表 ， 该 方法 不 需要 传 入 参数 。 
使 用 该 方法 的 示例 如 下 : 

>>> num=[1,2,3] 

>>> print(' 列 表 反 转 前 num: ' ,num) 

列表 反 转 前 num: [1，2，3] 

>>> num.reverse!() 

>>> print(' 列 表 反 转 后 : ' ,num) 

列表 反 转 后 : [3，2，1] 


由 上 面 的 输出 结果 看 到 ， 该 方法 改变 了 列表 但 不 返回 值 (和 前 面 的 remove 一 样 ) 。 





如 果 需 要 对 一 个 序列 进行 反 向 迭代 ， 那 么 可 以 使 用 reversed 函数 。 这 个 函数 并 不 返回 列表 ， 
而 是 返回 一 个 只 代 器 ( Iterator ) 对 象 ( 该 对 象 在 后 面 会 详细 介绍 )， 可 以 通过 list 函数 把 返 
回 的 对 象 转换 为 列表 ， 例 如 : 


>>> num=[1,2,3] 
>>> Print (' 使 用 reversed 函数 翻转 结果 : ', list (reversed (num) ) ) 
使 用 reversed 函数 翻转 结果 : [3，2，1] 


输出 结果 对 原 序 列 反 向 迭代 了 。 
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9. sort 


sort() 方 法 用 于 对 原 列表 进行 排序 ， 如 果 指 定 参数 ， 就 使 用 参数 指定 的 比较 方法 进行 排序 。 
sort() 方 法 的 语法 如 下 : 





list.sort(func) 


此 语法 中 ，list 代表 列表 ，func 为 可 选 参数 。 如 果 指 定 该 参数 ， 就 会 使 用 该 参数 的 方法 进行 排 
序 。 
使 用 该 方法 的 示例 如 下 : 


>>> num=[5,8,1,3,6] 

>>> num.sort() 

>>> print ('num 调 用 sort 方法 后 : ', num) 
num 调 用 sort 方法 后 : [1, 3, 5, 6, 8] 


由 上 面 输出 的 结果 得 知 ，sort 方法 改变 了 原来 的 列表 ， 而 不 是 简单 地 返回 一 个 il 

我 们 前 面 学 习 过 几 个 改变 列表 却 不 返回 值 的 方法 〈 如 append) ， 不 能 将 操作 结果 赋 给 一 个 
量 , 这 样 的 行为 方式 很 合 常理 。 但 当 用 户 需 要 一 个 排 好 序 的 列表 副本 , 同时 又 保留 原 有 列表 不 变 时 ， 
可 能 会 做 如 下 操作 : 


>>> num=[5,8,1,3,6] 

>>> n=num. sort () 

>>> print(' 变 量 n 的 结果 是 : ',n) 

变量 n 的 结果 是 : None 

>>> print(' 列 表 num 排序 后 的 结果 是 : ', num) 
列表 num 排序 后 的 结果 是 : [1，3，5，6，8] 


输出 结果 怎么 和 我 们 预期 的 不 一 样 呢 ? 因为 sort 方法 修改 了 列表 num， 但 是 返回 的 是 空 值 ， 
所 以 我 们 最 后 得 到 的 是 已 排序 的 num 和 值 为 None 的 n。 该 想法 正确 的 实现 方式 是 先 把 num 的 副本 
赋值 给 n， 然 后 对 n 进行 排序 ， 操 作 如 下 : 


>>> num=[5,8,1,3,6] 

>>> n=num # 直 接 将 列表 num 赋值 给 n 
>>> n.sort () 

>>> print(" 变 量 n 的 结果 是 : ',n) 

变量 n 的 结果 是 : [1，3，5，6，8] 

>>> print('num 的 结果 是 : ', num) #num 也 被 排序 了 
num 的 结果 是 : [1，3，5，6，8] 

>>> num=[5,8,1,3,6] 

>>> n=num[:] # 将 列表 num 切片 后 赋值 给 n 
>>> n.sort () 

>>> print(' 变 量 n 的 结果 是 : ',n) 

变量 n 的 结果 是 : [1，3，5，6，8] 

>>> print('num 的 结果 是 : ', num) #num 保持 原样 

num 的 结果 是 : [5，8，1，3，6] 


由 上 面 的 执行 结果 可 以 看 到 , 若 不 将 原 列表 (如 列表 num) 分 片 后 赋值 给 另 一 个 变量 (如 n) ， 
则 两 个 列表 都 会 被 排序 ， 这样 简 单 的 赋值 后 ， 两 个 列表 都 指向 同一 个 列表 。 由 此 提醒 进行 该 操作 时 
要 记得 对 原 列 表 分 片 。 

如 reverse 方法 一 样 ,sort 方法 也 有 一 个 有 同样 功能 的 函数 一 一 sorted 函数 。 该 函数 可 以 直接 获 
取 列 表 的 副本 进行 排序 ， 使 用 方式 如 下 : 
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>>> num=[5,8,1,3,6] 

>>> n=sorted (num) 

>>> print(' 变 量 n 的 操作 结果 是 : ' ,n) 

变量 n 的 操作 结果 是 : [1，3，5，6，8] 

>>> print('num 的 结果 是 : ', num) #num 保持 原样 

num 的 结果 是 : [5，8，1，3，6] 

执行 结果 和 前 面 操作 的 一 样 。sorted 函数 可 以 用 于 任何 序列 ， 返 回 结果 都 是 一 个 列表 。 例 如 下 
面 的 操作 : 

>>> sorted('python') 

[hn vor, pt ry'] 

>>> sorted('321') 

[1 2', 131] 


10. clear 

clear0 方 法 用 于 清空 列表 ， 类 似 于 del a[:]。 
clear() 方 法 的 语法 如 下 : 

list.clear() 

此 语法 中 ，list 代表 列表 ， 不 需要 传 入 参数 。 
使 用 该 方法 的 示例 如 下 : 


>>> field=['study', 'python','is','happy'] 
>>> field.clear() 

>>> print ('field 调用 clear 方法 后 的 结果 : ', fiel1d) 
field 调用 clear 方法 后 的 结果 : [] 


由 操作 结果 看 到 ，clear 方法 会 清空 整个 列表 ， 调 用 该 方法 进行 清空 很 简单 ， 但 也 要 小 心 ， 因 
为 一 不 小 心 就 可 能 把 整个 列表 都 清空 了 。 

11. copy 

copy() 方 法 用 于 复制 列表 ， 类 似 于 a[:] 。 

copy0 方 法 的 语法 如 下 : 

list.copy() 

此 语法 中 ，list 代表 列表 ， 不 需要 传 入 参数 。 

使 用 该 方法 的 示例 如 下 : 


>>> field=['study', 'python', 'is', 'happy'] 

>>> copyfield=field.copy() 

>>> print (' 复 制 操作 结果 : ', copyfield) 

复制 操作 结果 : ['study'，'python','is','happy'] 


操作 结果 和 该 方法 的 意思 一 样 ， 是 原原本本 的 复制 操作 。 

12. 高 级 排序 

如 果 希 望 元 素 按 特 定 方式 进行 排序 〈 不 是 sort 方法 默认 的 按 升序 排列 元 素 ) ， 就 可 以 自 定义 
比较 方法 。 

sort 方法 有 两 个 可 选 参数 ， 即 key 和 reverse。 要 使 用 它们 ， 就 要 通过 名 字 指 定 ， 我 们 称 之 为 关 
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键 字 参 数 。 例 如 下 面 的 示例 : 


>>> field=['study', 'python', 'is', happy'"] 


>>> field.sort (key=len) # 按 字符 串 由 短 到 长 排序 

>>> field 

>>> field.sort (key=len, reverse=True) # 按 字符 串 由 长 到 短 排序 ， 传 递 两 个 参数 
>>> field 


['python', "study'， 'happy', "is'] 

['is', 'study', 'happy', "Python'] 

>>> num=[5,8,1,3,6] 

>>> num.sort (reverse=True) # 排 序 后 逆序 

>>> num 

[8, 6, 5, 3, 1] 

由 上 面 的 操作 结果 可 知 ，sort 方法 带 上 参数 后 的 操作 是 很 灵活 的 ,可 以 根据 自己 的 需要 灵活 使 
用 该 方法 。 关 于 自 定义 函数 ， 后 续 章节 会 有 更 详细 的 介绍 。 


3.3 元 组 


Python 的 元 组 与 列表 类 似 ， 不 同 之 处 在 于 元 组 的 元 素 不 能 修改 前 面 多 次 提 到 的 字符 串 也 是 不 
能 修改 的 ) 。 创 建 元 组 的 方法 很 简单 ， 如 果 你 使 用 逗号 分 阳 了 一 些 值 ， 就 会 自动 创建 元 组 。 

例如 ， 我 们 如 下 输入 : 

SS 

(1, 2, 3) 

>>> 'hello','world’' 

('hello', 'world') 

上 面 的 操作 用 逗号 分 隔 了 一 些 值 ， 结 果 输 出 的 是 元 组 。 

我 们 经 常 使 用 圆 括 号 将 值 括 起 来 ， 例 如 : 

>>> (1, 2, 3) 

(1, 2, 3) 

>>> ('hello', "world') 

('hello', 'world') 

还 可 以 创建 空 元 组 ， 操 作 如 下 : 

>>> () 

0 

如 果 圆 括号 中 不 包含 任何 内 容 ， 就 是 一 个 空 元 组 。 

创建 包含 一 个 值 的 元 组 如 何 实现 呢 ? 可 以 进行 如 下 尝试 : 

>>> (1) 

输出 结果 不 是 元 组 ， 包 含 一 个 值 的 元 组 的 实现 方式 有 一 些 奇特 ， 必 须 在 括号 中 的 元 素 后 加 一 
个 逗号 ， 例 如 : 


Ss RY 
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(1,) 


由 上 面 的 示例 看 到 ， 和 逗号 很 重要 ， 只 添加 括号 是 没有 用 的 。 
下 面 我 们 介绍 元 组 的 相关 操作 。 


3.3.1 tuple 函数 


tuple 函数 的 功能 和 list 函数 基本 上 一 样 ， 都 是 以 一 个 序列 作为 参数 ， 并 把 它 转换 为 元 组 。 如 
果 参 数 是 元 组 ， 参 数 就 会 被 原样 返回 ， 例 如 

>>> tuple(['hello', 'world']) 

('hello', ‘'world') 

>>> tuple('hello') 

Wn er on) 

>>> tuple(('hello', 'world')) # 参 数 是 元 组 

('hello', ‘'world') 


由 上 面 的 操作 看 到 ，tuple 函数 传 入 元 组 参数 后 ， 得 到 的 返回 值 就 是 传 入 的 参数 。 


3.3.2 元 组 的 基本 操作 


和 列表 一 样 ， 元 组 也 有 一 些 基 本 操作 ， 如 访问 元 组 、 修 改元 组 、 删 除 元 组 、 索 引 和 截取 等 操 
作 。 当 然 ， 这 里 的 修改 、 删 除 和 截取 等 操作 和 列表 的 操作 不 太一 样 。 


1. 访问 元 组 
可 以 使 用 下 标 索引 访问 元 组 中 的 值 ， 例 如 : 


>>> mix = ('hello', 'world', 2015, 2016) 
>>> print ("mix[1] is: ", mix[1]) 
mix[1] is: world 

>>> num = (1, 2, 3, 4, 5, 6, 7) 

>>> print ("num[1:5] is: ", num[1:5]) 
num[1:5] is: (2, 3, 4, 5) 


2. 修改 元 组 
元 组 中 的 元 素 值 不 允许 修改 ， 但 可 以 对 元 组 进行 连接 组 合 ， 例 如 : 


>>> field = ('hello', "world') 

>>> num = (2015, 2016) 

>>> print ("合并 结果 为 : "， field+num) 

合并 结果 为 : ('hello'，'world'!，2015，2016) 


3. 删除 元 组 
元 组 中 的 元 素 值 不 允许 删除 ， 但 可 以 使 用 del 语句 删除 整个 元 组 ， 例 如 : 
>>> field = ('hello', 'world') 


>>> del field 

>>> Print(" 删 除 后 的 结果 : '，, field) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
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NameError: name 'field' is not defined 


以 上 实例 的 元 组 被 删除 后 , 输出 变量 会 有 异常 信息 , 输出 结果 告诉 我 们 field 没有 定义 , 即 field 
已 经 不 存在 了 。 
4. 元 组 索引 、 截 取 


因为 元 组 也 是 一 个 序列 ， 所 以 可 以 访问 元 组 中 指定 位 置 的 元 素 ， 也 可 以 截取 索引 中 的 一 段 元 
素 ， 例 如 : 


>>> field = ('hello', 'world', 'welcome') 
>>> field [2] 

'welcome' 

>>> field [-2] 

'world’' 

>>> field [1:] 

('world', 'welcome') 


3.3.3 ”元 组 内 置 函数 


Python 元 组 提供 了 一 些 内 置 函 数 ， 如 计算 元 素 个 数 、 返 回 最 大 值 、 返 回 最 小 值 、 列 表 转 换 等 
函数 。 

len(tuple) 用 于 计算 元 组 元 素 的 个 数 。 使 用 方式 如 下 : 

>>> tup = ('hello', 'world', 'welcome') 


>>> len (tup) 
3 


max(tuple) 用 于 返回 元 组 中 元 素 的 最 大 值 。 使 用 方式 如 下 : 
>>> tup = ('6', '3', '8') 

>>> max (tup) 

48， 

min(tuple) 用 于 返回 元 组 中 元 素 的 最 小 值 。 使 用 方式 如 下 : 
>>2 Cp MG 3 OY 

>>> min (tup) 

‘3 

tuple(seq) 用 于 将 列表 转换 为 元 组 。 使 用 方式 如 下 : 

>>> field= ['hello', 'world', 'welcome'] 

>>> tup=tuple (field) 


>>> tup 
('hello', "world'， 'welcome') 


以 上 为 Python 中 常见 的 一 些 元 组 的 内 置 函 数 ， 大 家 可 以 自行 操作 其 他 函数 进行 尝试 。 
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3.4 ”列表 与 元 组 的 区 别 


我 们 前 面 提 到 列表 与 元 组 的 区 别 在 于 元 组 的 元 素 不 能 修改 ， 元 组 一 旦 初始 化 就 不 能 修改 。 

不 可 变 的 元 组 有 什么 意义 ? 因为 元 组 不 可 变 ， 所 以 代码 更 安全 。 如 果 可 能 ， 能 用 元 组 代 蔡 列 
表 就 尽量 用 元 组 。 我 们 看 下 面 的 示例 : 

> 

>>> 七 [2] [0] = 'X" 

>>> t[2] [1] = 'Y' 

bt 

(DR) 

此 处 使 用 了 嵌 套 列表 ， 一 个 列表 中 包含 男 一 个 列表 ， 也 可 以 称 为 二 维 数组 。 一 个 单一 的 列表 
称 为 一 维 数组 , 还 有 三 维 、 四 维 等 多 维 数组 ， 不 过 一 般 一 维和 二 维 数组 用 得 最 多 ， 三维 以 上 的 数组 
基本 很 少 用 到 。 

取 二 维 数组 中 元 素 的 方式 为 : 先 取得 二 维 数组 里 嵌 套 的 数组 ， 如 上 例 中 的 t[2]， 取 得 的 是 ['A'， 
'B]，t[2] 是 一 个 一 维 数组 ， 从 一 维 数 组 中 获取 元 素 是 以 a[0] 的 方式 获取 的 ， 因 而 从 t[2] 中 取得 编号 
为 0 的 元 素 的 方式 是 t[2][0]。 

上 面 的 元 组 定义 时 有 3 个 元 素 ， 分 别 是 a'、'b 和 一 个 list 列表 。 不 是 说 元 组 一 旦 定义 就 不 可 变 
了 ， 怎 么 后 来 又 变 了 ? 

别 急 ， 我 们 先 看 看 定义 时 元 组 包含 的 3 个 元 素 ， 如 图 3-1 所 示 。 

当 我 们 把 list 列表 的 元 素 'A' 和 'B' 修 改 为 'X' 和 'Y' 后 ， 元 组 如 图 3-2 所 示 。 


t t 加 、 
% 
tuple \ tuple 
0 [1 |2 Mo [i fz 



























































图 3-1 元 组 定义 图 3-2 元 组 “修改 ” 
表面 上 看 ， 元 组 的 元 素 确实 变 了 ， 其 实 变 的 不 是 元 组 的 元 素 ， 而 是 list 列表 的 元 素 。 元 组 一 开始 
指向 的 list 列表 并 没有 改 成 别 的 list 列表 ， 所 以 元 组 的 “不 变 ” 是 指 每 个 元 素 的 指向 永远 不 变 ， 如 指向 
'a 就 不 能 改 成 指向 'b'， 指 向 一 个 list 就 不 能 改 成 指向 其 他 对 象 ， 但 指向 的 list 列表 本 身 是 可 变 的 。 
理解 了 “指向 不 变 ” 后 ， 创 建 一 个 内 容 不 变 的 tuple 要 怎么 做 ? 这 时 必须 保证 tuple 的 每 一 个 
元 素 本 身 也 不 能 变 。 
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3.5 ”牛刀 小 试 一 一 列表 与 元 组 相互 转化 


列表 和 元 组 虽然 有 一 定 区 别 ， 但 这 两 者 之 间 是 可 以 相互 转化 的 。 看 如 下 小 示例 : 


>3> # 《UP18 一 一 一 一 一 一 一- 一 一 一 >list 





>>> tup= (123, 'hello', [23, ' 中 国 '], ('python3.7', 'learn')) 
>>> tup 

(123，'hello'，[23,，' 中 国 ']，('python3.7'，'learn')) 
>>> tup21s = list(tup) 


>>> tup21s 
[123，"hello'，[23， "中 国 ']，("python3.7"， "learn')] 
全 Se 


>>> ls2tup = tuple (tup21s) 
>>> 1s2tup 
(123，'hello'，[23,，' 中 国 ']，('python3.7'，'learn')) 


3.6 调 试 


这 里 通过 设置 一 些 错 误 让 读者 认识 在 编写 代码 过 程 中 的 常见 问题 ， 以 帮助 读者 熟悉 和 解决 实 


际遇 到 的 问题 。 


(1) 对 序列 中 的 元 素 进行 访问 时 ， 输 入 序列 中 不 存在 的 编号 ， 如 在 greeting='Hello' 示 例 中 输 


入 greeting[10]， 会 得 到 什么 结果 ? 输入 greeting[-10] 又 会 得 到 什么 结果 ? 在 交互 模式 下 进行 验证 : 


>>> greeting='hello' 
>>> len (greeting) # 获 取 字符 串 长 度 
5 
>>> greeting[10] ”# 编 号 超过 最 大 长 度 编号 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
IndexError: string index out of range 
>>> greeting[5] # 字 符 串 长 度 为 5， 但 最 大 编号 不 是 5 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
IndexError: string index out of range 
>>> greeting[len (greeting)-1] # 最 大 编号 是 字符 串 长 度 减 1 
‘or 
>>> greeting[-10] 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
IndexError: string index out of range 
>>> greeting[-1] 
or 
>>> greeting[-5] 
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从 以 上 输出 结果 看 出 ， 以 正 数 索 引 时 ， 编 号 从 0 开始 ， 最 后 一 个 元 素 的 编号 是 len(str)-1; 以 
负数 索引 时 ， 从 -1 开始 ， 可 以 取 到 -len(str) 的 元 素 。 

当 索 引 超出 范围 时 ，Python 会 报 一 个 IndexError 错误 ， 即 索引 越界 错误 。 要 确保 索引 不 越界 ， 
记得 最 后 一 个 元 素 的 索引 是 len(str) - 1。 

(2) 分 片 操作 中 ， 索 引 值 大 于 列表 的 最 大 编号 时 ， 操 作 会 报错 吗 ? 结果 是 怎样 的 ? 在 交互 模 
式 下 输入 如 下 : 


>>> number=[1,2,3,4,5,6,7,8,9,10] 
>>> number[7:15] 
[8, 9, 10] 
>>> number[-100:-1] 
[1，2，3，4，5，6，7，8，9] # 最 后 一 个 元 素 没有 取 到 
由 以 上 操作 结果 看 到 没有 报错 ， 并 且 超 出 部 分 没有 输出 任何 内 容 。 这 里 要 声明 一 点 : 分 片 操 
作 不 存在 索引 越界 的 问题 ， 分 片 操 作对 不 存在 的 编号 返回 空 值 ， 存 在 的 就 返回 对 应 值 。 所 以 
number[7:15] 返 回 [8, 9, 10]，number[-100:-1] 返 回 [1, 2, 3, 4, 5, 6, 7, 8, 9]。 
(3) 输入 以 下 代码 会 得 到 什么 结果 ? 
>>> max (a,b,c) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
NameError: name 'a' is not defined 
>>> max('a','b','c') 
‘ec! 
第 一 个 输出 错误 信息 ， 因 为 a、b、c 没有 定义 ， 这 个 操作 要 注意 字符 串 的 表示 形式 。 第 二 个 输 
出 结果 为 ce，max 不 但 能 操作 数字 ， 而 且 能 操作 字符 ， 字 符 按 字典 排序 取 值 。 











3.7 ”问题 解答 


(1) 通用 序列 操作 真 的 通用 吗 ? 

答 : 这 个 是 不 用 质疑 的 ， 已 经 有 很 多 前 辈 试 验 并 得 出 结论 。 如 果 有 问题 ， 我 们 可 以 自己 试验 
证 明 ， 毕 竟 计 算 机 目前 还 没有 学 会 撤 谎 。 

(2) 如 何 选 择 使 用 列表 还 是 元 组 ? 

答 : list 和 tuple 是 Python 内 置 的 有 序 集合 ， 一 个 可 变 ， 一 个 不 可 变 。 根 据 需要 选择 使 用 其 中 
的 一 种 ， 建 议 如 我 们 在 介绍 两 者 区 别 时 所 讲述 的 : 因为 元 组 不 可 变 ， 所 以 代码 更 安全 ， 如 果 可 能 ， 
能 用 元 组 代替 列表 就 尽量 用 元 组 。 
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3.8 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲解 了 列表 和 元 组 ， 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 


(1) 通用 序列 的 基本 操作 有 哪些 ? 
(2) 列表 有 哪些 操作 和 方法 ? 
(3) 元 组 有 哪些 基本 操作 ? 内 置 函数 如 何 使 用 ? 
(4) 列表 与 元 组 的 区 别 是 什么 ? 
思考 并 解决 如 下 问题 : 
(1) 自 定义 一 个 变量 ， 并 赋值 china， 然 后 进行 索引 ， 观 察 各 索引 位 置 的 输出 值 。 
(2) 自 定义 一 个 变量 ， 并 任意 赋 一 个 值 ， 对 变量 进行 分 片 。 
(3) 定义 两 个 序列 ， 对 序列 相 加 。 
(4) 定义 多 个 序列 ， 对 序列 相 加 。 
(5) 定义 不 同 的 变量 ， 对 变量 做 乘法 操作 。 
(6) 定义 不 同 的 变量 ， 取 得 变量 的 长 度 、 最 小 值 和 最 大 值 。 
(7) 自 定义 一 个 列表 ， 对 列表 进行 重新 赋值 、 增 加 元 素 、 删 除 元 素 等 操作 。 
(8) 自 定义 一 个 列表 ， 计 算 各 个 元 素 在 列表 中 出 现 的 次 数 ， 并 打印 各 个 元 素 在 列表 中 出 现 的 
位 置 。 
(9》 自 定义 一 个 列表 ， 对 列表 重新 排序 后 复制 给 另 一 个 列表 ， 再 对 原 列表 做 删除 元 素 、 增 加 
元 素 、 反 转 列 表 、 清 空 列表 等 操作 。 
(10》 自 定义 一 个 元 组 ， 对 元 组 进行 访问 ， 并 对 元 组 进行 修改 、 删 除 、 索 引 、 截 取 等 操作 。 
(11) 用 负数 步 长 对 列表 和 元 组 进行 分 片 。 
(12) 用 索引 取出 下 面 list 的 指定 元 素 : 
field= [ 
['hello', "world', 'welcome'], 
['study', 'Python', 'is', 'funny'], 
['good', 'better', 'best'] 
1 








# 输出 hello: 
print (?) 

# 输出 Python: 
print (?) 

# 输出 best: 
print (?) 
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小 程序 资源 二 维 码 





知识 拓展 习 是 代码 实例 
le 一 。 








扫 码 看 视频 





我 们 前 面 已 经 接触 过 字符 串 ， 也 了 解 了 一 些 基 本 操作 ， 对 字符 串 的 创建 、 索 引 和 分 片 等 操作 
已 经 有 了 初步 理解 。 本 章 将 介绍 字符 串 的 格式 化 、 分 割 、 搜 索 等 方法 。 


4.1 字符 串 的 基本 操作 


字符 串 是 Python 中 常用 的 数据 类 型 ， 我 们 可 以 使 用 引号 〈' 或 ") 创建 字符 串 。 创 建 字符 串 很 
简单 ， 只 要 为 变量 分 配 一 个 值 即 可 ， 请 看 下 面 的 例子 : 

>>> field='Hello' 。 # 创 建 字符 串 Hello， 并 赋 给 变量 field 

所 有 标准 序列 操作 〈 如 索引 、 分 片 、 成 员 资格 、 求 长 度 、 取 最 小 值 和 最 大 值 等 ) 对 字符 串 同 
样 适用 ， 我 们 在 前 面 章节 已 经 讲解 了 这 些 操 作 。 不 过 字符 串 是 不 可 变 的 ， 所 以 字符 串 做 不 了 分 片 赋 
值 。 请 看 如 下 操作 : 

>>> field='just do it' 

>>> field[-3:] 

， it， 

>>> field[-3:]='"now'" 

Traceback (most recent call last) : 

File "<stdin>", line 1, in <module> 

TypeError: "str' object does not support item assignment 

输出 结果 告诉 我 们 str 类 型 的 对 象 不 支持 更 改 。 

我 们 讲述 了 这 么 多 字符 串 , 还 没有 看 到 如 何在 输出 语句 中 输出 两 行 , 这 个 操作 该 怎么 实现 呢 ? 
例如 : 


>>> print (' 精 诚 所 至 \n 金石 为 开 ') 
精诚 所 至 
金石 为 开 
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输出 结果 为 两 行 ， 这 里 使 用 了 转 义 字符 m， 表 示 换 行 。Python 中 有 很 多 转 义 符 ， 表 4-1 列 出 了 
一 些 常 用 的 转 义 字符 。 


表 4-1 Python 中 的 转 义 字符 



































转 义 字符 描述 描述 
\ (在 行 尾 时 ) “| 续 行 符 换行 
\ 反 斜 杠 符号 纵向 制 表 符 
Vv 单 引号 横向 制 表 符 
by 双 引 号 回 车 
\a 响 铃 换 页 
\b 退 格 (Backspace) 八进制 数 ，yy 代表 的 字符 ， 如 \o12 代表 换行 
\e 转 义 十 六 进 制 数 ，yy 代表 的 字符 ， 如 wx0a 代表 换行 
\000 EE 其 他 字符 以 普通 格式 输出 

对 于 前 面 的 示例 ， 若 要 以 如 下 格式 输出 ， 则 需要 使 用 转 义 字符 : 

' 精 诚 所 至 ' 

' 金 石 为 开 ' 

例如 : 

>>> print ('" "精诚 所 至 '\n "金石 为 开 ' ') # 不 使 用 转 义 字符 

File "<stdin>", line 1 
print ('' 精 诚 所 至 '\n' 金 石 为 开 ' ') 

SyntaxError: invalid syntax 

>>> print ('\' 精 诚 所 至 \'\n\' 金 石 为 开 \' ') # 使 用 \ ' 转 义 字 符 

' 精 诚 所 至 ' 

' 金 石 为 开 ' 


由 操作 结果 可 知 ， 使 用 \ 转 义 字符 得 到 了 想 要 的 结果 ， 不 使 用 转 义 字符 不 能 输出 对 应 结果 。 在 
Python 中 进行 字符 串 的 操作 时 ， 如 果 涉 及 一 些 需要 做 转 义 的 操作 ， 就 要 使 用 转 义 字符 。 这 些 字符 
无 须 刻意 记忆 ， 先 有 一 些 了 解 即 可 ， 在 后 面 的 学 习 中 结合 实际 操作 会 逐渐 熟练 使 用 。 


4.2 字符 串 格式 化 


到 目前 为 止 ， 我 们 对 字符 串 的 操作 都 停留 在 赋值 、 重 新 赋值 、 索 引 、 分 片 和 输出 等 一 些 比较 
基本 的 操作 上 ， 其 实 字符 串 还 有 更 多 、 更 好 的 操作 方式 ， 比 如 在 实际 项 目 开 发 中 经 常 使 用 的 字符 串 
格式 化 操作 。 


4.2.1 字符 串 格式 化 符号 


字符 串 格式 化 使 用 操作 符 百 分 号 〈%) 实现 。 
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提 ” 示 
% 也 可 以 用 作 模 运 ( 求 余 ) 操作 符 。 
例如 : 
>>> print ('hello,%s' % 'world') 
hello,world 
>>> print (' 小 智 今 年 $s 岁 了 ' % 10) 
小 智 今年 10 岁 了 


由 上 面 输入 的 内 容 可 知 , % 左 边 放置 了 一 个 待 格式 化 的 字符 串 , 右边 放置 的 是 希望 格式 化 的 值 。 
格式 化 的 值 可 以 是 一 个 字符 串 或 数字 。 

格式 化 字符 串 的 %s 部 分 称 为 转换 说 明 符 , 标记 了 需要 放置 转换 值 的 位 置 , 通用 术语 为 占 位 符 。 
可 以 想象 成 在 学 校 上 自习 , 我 们 通常 会 放 一 个 物品 在 一 个 位 置 上 , 其 他 人 一 看 就 知道 这 个 位 置 被 占 
了 ， 而 我 们 无 论 什么 时 候 去 自习 ， 直 接 到 自己 占 好 的 位 置 坐 下 即 可 。 这 里 可 以 把 %s 当 作 我 们 使 用 
的 物品 ， 我 们 相当 于 后 面 % 右 边 的 值 。 

在 上 面 的 示例 中 , s 表示 百 分 号 右边 的 值 会 被 格式 化 为 字符 串 ，s 指 的 是 str。 如 果 不 是 字符 串 ， 
就 会 使 用 str 将 其 转换 为 字符 串 。 示 例 中 就 将 10 转换 为 字符 串 了 ， 这 种 方式 对 大 多 数 数值 都 有 效 。 

这 里 提供 了 字符 串 格式 化 的 方式 ， 但 若 需 要 转换 为 其 他 格式 ， 该 怎么 办 呢 ? Python 为 我 们 提 
供 了 表 4-2 所 示 的 格式 化 符号 。 


表 4-2 字符 串 格式 化 符号 








符号 描述 描述 
%e 格式 化 字符 及 其 ASCII 码 格式 化 浮 点 数字 ， 可 指定 精度 值 
%s 格式 化 字符 串 用 科学 计数 法 格式 化 浮 点 数 





%d 格式 化 整数 

%u 格式 化 无 符号 整 型 

%o 格式 化 无 符号 八进制 数 

%x 格式 化 无 符号 十 六 进 制 数 

%X_ | 格式 化 无 符号 十 六 进 制 数 大 写 ) 


根据 表 4-2， 前 面 的 示例 可 以 使 用 以 下 两 种 方式 : 

>>> Print (' 小 智 今年 ss 岁 了 ' % 10) # 使 用 ss 作为 10 的 占 位 符 

小 智 今年 10 岁 了 

>>> print (' 小 智 今年 $d 岁 了 ' % 10) # 使 用 %d 作为 10 的 占 位 符 

小 智 今年 10 岁 了 

由 操作 结果 看 到 ， 整 数 既 可 以 使 用 %s 也 可 以 使 用 %d 进行 格式 化 。 

如 果 要 格式 化 实数 〈 浮 点 数 ) ， 就 可 以 使 用 %f 进行 格式 化 ， 例 如 : 

>>> print (' 圆 周 率 PI 的 值 为 : $f' % 3.14) 

圆周 率 PI 的 值 为 : 3.140000 

输出 结果 中 有 很 多 位 小 数 ， 但 传 入 的 值 只 有 两 位 小 数 ， 要 解决 这 个 问题 可 以 使 用 格式 化 符号 。 

从 表 4-2 可 知 ，%f 可 指定 精度 值 。 在 Python 中 ， 使 用 %f 时 ， 若 不 指定 精度 值 ， 则 默认 输出 6 
位 小 数 。 


作用 同 %e， 用 科学 计数 法 格式 化 浮 点 数 
%f 和 %e 的 简写 

%f 和 %E 的 简写 

用 十 六 进 制 数 格式 化 变量 的 地 址 














以 指定 2 位 小 数 为 例 ， 指 定 精度 值 的 格式 如 下 : 

和 ,2£ 

指定 精度 值 的 格式 为 一 个 英文 格式 下 的 句点 加 上 希望 保留 的 小 数位 数 。 因 为 格式 化 说 明 符 以 
表示 类 型 的 字符 结束 ， 所 以 精度 值 应 该 放 在 类 型 字符 前 面 。 

使 用 这 个 格式 更 改 上 面 圆 周 率 输出 的 示例 : 

>>> print (' 圆 周 率 PI 的 值 为 : %$.2f' $ 3.14) 

圆周 率 PI 的 值 为 : 3.14 

输出 结果 正 是 我 们 希望 得 到 的 。 

表 4-2 中 的 符号 不 是 所 有 都 常用 ， 比 较 常 用 的 有 %s、%d、%f 三 个 ，%e 和 %E 在 科学 计算 中 
使 用 比较 多 ， 其 他 符号 了 解 就 可 以 ， 有 兴趣 也 可 以 自行 研究 。 

假如 我 们 要 输出 类 似 1.23% 这 样 的 结果 ， 直 接 使 用 加 号 加 一 个 百 分 号 可 以 吗 ? 尝试 如 下 : 

>>> print (' 小 智 的 识别 能 力 比 去 年 提高 了 : %.2f' % 1.23+'%"') 

小 智 的 识别 能 力 比 去 年 提高 了 : 1.23% 

输出 结果 得 到 了 我 们 想 要 的 ， 说 明 这 种 方式 可 以 。 不 过 输入 的 代码 看 起 来 怪 怪 的 ， 有 没有 更 
好 的 办 法 呢 ? 例如 : 

>>> print (' 小 智 的 识别 能 力 比 去 年 提高 了 : %.2f%%' % 1.23) 

小 智 的 识别 能 力 比 去 年 提高 了 : 1.23% 

用 这 种 方式 也 得 到 了 我 们 想 要 的 结果 。 不 过 我 们 在 f 字 符 后 面 使 用 了 两 个 %, 结果 只 输出 了 一 
个 ， 这 是 怎么 回 事 ? 

在 Python 中 ， 字 符 串 中 的 百 分 号 是 转换 说 明 符 ， 如 果 要 输出 %， 就 需要 格式 化 字符 %， 从 而 
需要 使 用 %%。 使 用 这 种 方式 操作 的 功能 类 似 : 


>>> Print (' 输 出 百 分 号 :%$s' % '%') 
输出 百 分 号 :% 





4.2.2 字符 串 格 式 化 元 组 


格式 化 操作 符 的 右 操 作 数 可 以 是 任何 元 素 。 如 果 是 元 组 或 映射 类 型 (如 字典 ， 第 5 章 进行 讲 
解 ) ， 那 么 字符 串 格式 化 将 会 有 所 不 同 。 我 们 尚未 涉及 映射 (字典 ) ， 这 里 先 了 解 一 下 元 组 。 

如 果 右 操作 数 是 元 组 ， 其 中 每 一 个 元 素 都 会 被 单独 格式 化 ， 每 个 值 都 需要 一 个 对 应 的 转换 说 
明 符 ， 例 如 : 


>>> print (' 今 年 是 $s 年 ， 中 国 女 排 夺 得 本 届 奥 运 会 ss， 中 国共 获得 $d 枚 金牌 '%$('2016',' 冠 军 ', 26) ) 
今年 是 2016 年 ， 中 国 女排 夺 得 本 届 奥 运 会 冠军 ， 中 国共 获得 26 枚 金牌 
>>> print (' 今 年 是 $s 年 ， 中 国 女排 夺 得 本 届 奥 运 会 ss， 中 国共 获得 sd 枚 金牌 ' $ '2016',' 冠 军 ' ,26) 
Traceback (most recent call last) : 

File "<stdin>", line 1, in <module> 
TypeError: not enough arguments for format string 


由 以 上 输出 结果 看 到 ， 在 有 多 个 占 位 符 的 字符 串 中 ， 可 以 使 用 元 组 传 入 多 个 格式 化 值 。 如 果 
需要 转换 的 元 组 作为 转换 表达 式 的 一 部 分 存在 ， 就 必须 将 它 用 圆 括号 括 起 来 ， 否 则 会 出 错 。 
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如 果 使 用 列表 或 其 他 序列 代替 元 组 ， 序 列 就 会 被 解释 为 一 个 值 。 只 有 元 组 和 字典 可 以 格式 
化 一 个 以 上 的 值 。 





下 面 介绍 基本 转换 说 明 符 。 注 意 ， 这 些 项 的 顺序 是 至 关 重 要 的 。 


(1) % 字 符 : 标记 转换 说 明 符 开始 。 
(2) 转换 标志 (可 选 ) : -表示 对 齐 ; + 表示 在 转换 值 之 前 要 加 上 正 负 号 ;，“”【〔 空 白字 符 ) 


表示 正 数 之 前 保留 空格 ;0 表示 转换 值 位 数 不 够 时 用 0 填充 。 


度 就 


(3) 最 小 字段 宽度 (可 选 ) : 转换 后 的 字符 串 至 少 应 该 具有 该 值 指定 的 宽度 。 如 果 是 *， 宽 
会 从 值 元 组 中 读 出 。 
(4) 点 〈.) 后 跟 精 度 值 (可 选 ) : 如 果 转 换 的 是 实数 ， 精 度 值 表示 出 现在 小 数 点 后 的 位 数 ; 





如 果 转 换 的 是 字符 串 ， 该 数字 就 表示 最 大 字段 宽度 ;如果 是 *， 精 度 就 会 从 元 组 中 读 出 。 


(5) 转换 类 型 : 参见 表 4-2。 
下 面 将 详细 讨论 上 述 5 个 注意 项 。 
1. 简单 转换 
例如 ， 输 入 以 下 代码 : 


>>> print (' 圆 周 率 PI 的 值 为 : %.2f' $% 3.14) 
圆周 率 PI 的 值 为 3.14 

>>> print (' 石 油价 格 为 每 桶 : $Ssd' % 96) 
石油 价格 为 每 桶 : $96 


由 上 面 的 输出 结果 可 以 看 到 ， 简 单 转换 只 需要 写 出 转换 类 型 ， 使 用 起 来 很 简单 。 
2. 字段 宽度 和 精度 
转换 说 明 符 包 括 字段 宽度 和 精度 。 字 段 宽 度 是 转换 后 的 值 所 保留 的 最 小 字符 个 数 ， 精 度 是 数 


字 转 换 结果 中 应 该 包含 的 小 数位 数 或 字符 串 转 换 后 的 值 所 能 包含 的 最 大 字符 个 数 。 


例如 : 

>>> print (' 圆 周 率 PI 的 值 为 : $10f' % 3.141593) # 字 段 宽度 为 10 

圆周 率 PI 的 值 为 。 3.141593 # 字 符 串 宽度 为 10， 被 字符 串 占据 8 个 空格 ， 剩 余 两 个 空格 
>>> print (' 保 留 2 位 小 数 ， 圆 周 率 PI 的 值 为 : $10.2f' % 3.141593) # 字 段 宽度 为 10 
保留 2 位 小 数 ， 圆 周 率 PI 的 值 为 : 3.14 # 字 符 串 宽度 为 10， 字 符 串 占据 4 个, 剩 6 个 
>>> Print (' 保 留 2 位 小 数 ， 圆 周 率 PI 的 值 为 : s.2f' 8 3.141593) 

保留 2 位 小 数 ， 圆 周 率 PI 的 值 为 3.14 # 输 出 ， 没 有 字段 宽度 参数 

>>> print (' 字 符 串 精度 获取 : %.5s' % ('hello world')) # 打 印字 符 串 前 5 个 字符 
字符 串 精度 获取 : hello 

由 输出 结果 可 知 ， 字 段 宽度 和 精度 都 是 整数 ， 并 通过 点 号 〈.) 分 隔 。 两 个 都 是 可 选 参数 ， 如 
再 看 以 下 代码 : 

>>> print (' 从 元 组 中 获取 字符 串 精度 : %$*.*s' % (10,5,'hello world')) 

从 元 组 中 获取 字符 串 精度 : hello # 输 出 字符 串 宽度 为 10、 精 度 为 5 


>>> Print (' 从 元 组 中 获取 字符 串 精度 : $.*s' % (5,'hello world')) 





从 元 组 中 获取 字符 串 精度 : hello # 输 出 精度 为 5 


由 输出 结果 看 到 ， 可 以 使 用 *( 星 号 ) 作为 字段 宽度 或 精度 〈 或 两 者 都 用 * ) ， 数 值 会 从 元 组 
中 读 出 。 
3. 符号 、 对 齐 和 0 填充 
开始 介绍 之 前 先 看 一 个 示例 : 
>>> print (" 圆 周 率 PI 的 值 为 : $010.2f' % 3.141593) 
圆周 率 PI 的 值 为 : 0000003.14 
输出 结果 是 不 是 怪 怪 的 ， 这 个 我 们 称 之 为 “ 标 表 ”。 在 字段 宽度 和 精度 之 前 可 以 放置 一 个 “ 标 
， 可 以 是 零 、 加 号 、 减 号 或 空格 。 零 表示 用 0 进行 填充 。 
减 号 (-) 用 来 左 对 齐 数值 ， 例 如 : 
>>> print (' 圆 周 率 PI 的 值 为 : $10.2f' % 3.14) 
圆周 率 PI 的 值 为 : 3.14 
>>> print (' 圆 周 率 PI 的 值 为 : %-10.2f' % 3.14) 
圆周 率 PI 的 值 为 :3.14 # 此 处 右 侧 为 多 出 的 空格 
从 输出 结果 看 到 ， 使 用 减 号 时 ， 数 字 右 侧 多 出 了 额外 的 空格 。 
空白 (“ ”) 表示 在 正 数 前 加 上 空格 ， 例 如 : 
>>> print(('% 5d' % 10)+'\n'+('% 5d' % -10)) 
10 
-10 
由 输出 结果 可 以 看 到 ， 该 操作 可 以 用 于 对 齐 正 负 数 。 
加 号 〈+) 表示 无 论 是 正 数 还 是 负数 都 表示 出 符号 ， 例 如 : 
>>> print((' 宽 度 前 加 加 号 : s+5d's10) +'Nn'+ (" 宽 度 前 加 加 号 ;8%+5d'"g-10) ) 
宽度 前 加 加 号 :+10 
宽度 前 加 加 号 : -10 
该 操作 也 可 以 用 于 数值 的 对 齐 。 
从 Python 3.6 开始 ， 引 入 了 一 种 新 的 字符 串 : _f-strings_， 格 式 化 字符 串 。 格 式 化 字符 串 带 全 
前 缀 ， 类 似 于 str.format() 接 受 的 格式 化 字符 串 。 它 们 包含 由 花 括号 括 起 来 的 替换 字段 。 替换 字 段 是 
表达 式 ， 它 们 会 在 运行 时 计算 ， 然 后 使 用 format0 协 议 进 行 格式 化 。 
_f-strings_ 使 用 方式 如 下 : 
>>> val_str = "Python 3.7" 
>>> print(f'welcom to begin {val_str}') 
welcom to begin Python 3.7 
>>> import decimal 
>>> width = 10 
>>> precision = 4 
>>> value = decimal.Decimal ("12.34567") 


>>> f"result: {value: {width}.{precision}}" 
'result: 12.35" 


由 
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4.3 字符 串 方 法 





第 3 章 介 绍 了 很 多 列表 的 方法 , 字符 串 的 方法 比 列表 还 多 , 因为 字符 串 从 string 模块 中 “继承 ” 
了 很 多 方法 。 
因为 字符 串 的 方法 比较 多 ， 所 示 这 里 只 介绍 一 些 特别 有 用 的 方法 ， 全 部 方法 见 附录 A。 





4.3.1 find() 方 法 


find() 方 法 用 于 检测 字符 串 中 是 否 包 含 子 字符 串 str。 如 果 指 定 beg (开始 ) 和 end (结束 ) 范 
围 ， 就 检查 是 否 包含 在 指定 范围 内 。 如 果 包 含 子 字符 串 ， 就 返回 开始 的 索引 值 ， 否 则 返回 -1。 
find() 方 法 的 语法 如 下 : 

















str.find(str, beg=0, end=len(string)) 


此 语法 中 ，str 代表 指定 检索 的 字符 串 ，beg 代表 开始 索引 ， 默 认为 0， end 代表 结束 索引 ， 默 
认为 字符 串 的 长 度 。 返 回 结果 为 子 串 所 在 位 置 的 最 左 端 索引 ， 如 果 没 有 找到 ， 就 返回 -1。 
该 方法 使 用 示例 如 下 : 


>>> field='do it now' 
>>> field.find('do') 

0 

>>> field.find('now') 

6 

>>> field.find('python') 
C7 


由 输出 结果 看 到 ， 如 果 找 到 字符 串 ， 就 返回 对 应 的 索引 值 ， 如 果 没 找到 字符 串 ; 就 返回 -1。 











字符 串 的 find 方法 返回 的 不 是 布尔 值 。 如 果 返 回 0， 就 表示 在 索引 0 处 找到 了 子 字 符 串 。 


find 方法 还 可 以 接受 参数 ， 用 于 表示 起 始点 和 结束 点 ， 例 如 : 
>>> field.find('it',2) # 提 供 起 点 

field.find('it',5) # 提 供 起 点 

a field.find('it',0,3) # 提 供 起 点 和 终点 
field.find('it',0,5) 

Se field. find('it',5,10) 

-1 


由 输出 结果 看 到 ， 可 以 通过 使 用 起 始 值 和 终止 值 查找 指定 的 范围 内 是 否 存在 指定 字符 串 。 





4.3.2 join() 方 法 


join() 方 法 用 于 将 序列 中 的 元 素 以 指定 字符 连接 成 一 个 新 字符 串 。 

join() 方 法 的 语法 如 下 : 

str.join(sequence) 

此 语法 中 ，str 代表 指定 检索 的 字符 串 ，sequence 代表 要 连接 的 元 素 序列 。 返 回 结果 为 指定 字 
符 连接 序列 中 的 元 素 后 生成 的 新 字符 串 。 

该 方法 使 用 示例 如 下 : 


>>> num=[1,2,3,4] 
>>> mark='+' 
>>> mark.join (num) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: sequence item 0: expected str instance, int found 
>>> num.join (mark) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'list' object has no attribute 'join'" 
>>> field=['1','2','3','4','5'] 
>>> print(' 连 接 字符 串 列表 : ' ,mark.join (field)) 
连接 字符 串 列表 : 1+2+3+4+5 
>>> field.join (mark) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'list' object has no attribute 'join'" 
>>> dirs='','home', 'data','hdfs' 
>>> print(' 路 径 : ','/'.join(dirs)) 
路 径 : /home/data/hdfs 


由 输出 结果 看 到 ， 进 行 join 操作 时 ， 调 用 和 被 调用 的 对 象 都 必须 是 字符 串 ， 任 意 一 个 不 是 字 
符 串 都 会 报错 。 








4.3.3 ”lower() 方 法 


lower(0) 方 法 用 于 将 字符 串 中 所 有 大 写字 符 转换 为 小 写 。 

lower() 方 法 的 语法 如 下 : 

str.lower() 

此 语法 中 ，str 代表 指定 检索 的 字符 串 ， 该 方法 不 需要 参数 。 返 回 结 果 为 字符 串 中 所 有 大 写字 
符 转 换 为 小 写 后 生成 的 字符 串 。 

该 方法 使 用 示例 如 下 : 

>>> field='DO IT NOW' 


>>> print(' 调 用 lower 得 到 字符 串 : ' ,field.lower()) 
调用 lower 得 到 字符 串 : do it now 
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>>> greeting="'Hello,World" 

>>> print (' 调 用 lower 得 到 字符 串 : ' ,greeting.lower()) 

调用 lower 得 到 字符 串 : hello,world 

由 输出 结果 看 到 ， 字 符 串 中 的 大 写字 母 全 部 转换 为 小 写字 母 了 。 

如 果 想 要 编写 “不 区 分 大 小 写 ” 的 代码 ， 就 可 以 使 用 lower 方法 。 如 果 想 要 在 一 个 字符 串 中 查 
找 某 个 子 字符 串 并 忽略 大 小 写 ， 也 可 以 使 用 lower 方法 ， 操 作 如 下 : 

>>> field='DO IT NOW' 

>>> field.find('"It') # 都 不 转换 为 小 写 ， 找 不 到 匹配 字符 串 








=1 
>>> field.lower() .find('It') # 被 查找 字符 串 不 转换 为 小 写 ， 找 不 到 匹配 字符 串 
-I 
>>> field.lower() .find('It' .lower()) # 使 用 lower 方法 转换 成 小 写 后 查找 
3 


由 输出 结果 看 到 ， 字 符 串 全 部 转换 为 小 写 后 能 匹配 到 对 应 子 串 。 


有 时 类 似 于 lower 这 样 的 字符 串 方法 并 不 能 如 我 们 所 愿 进行 工作 。 对 于 英文 字符 串 ，lower 


方法 在 处 理 时 一 点 问题 都 没有 ; 对 于 非 英文 字符 串 ，lower 方法 在 处 理 时 可 能 不 如 我 们 的 预 
期 ， 如 中 文 、 挪 威 文 等 。 





4.3.4 ”upper() 方 法 


upper() 方 法 用 于 将 字符 串 中 的 小 写字 母 转换 为 大 写字 母 。 

upper() 方 法 语法 如 下 : 

str.upper() 

此 语法 中 ，str 代表 指定 检索 的 字符 串 ， 该 方法 不 需要 参数 。 返 回 结果 为 小 写字 母 转换 为 大 写 
字母 的 字符 串 。 

该 方法 使 用 示例 如 下 : 

>>> field='do 让 now' 

>>> print (' 调 用 upper 得 到 字符 串 : '，, field.upper()) 

调用 upper 得 到 字符 串 : DO IT NOW 

>>> greeting='Hello,World' 

>>> print(' 调 用 upper 得 到 字符 串 : ' ,greeting.upper()) 

调用 upper 得 到 字符 串 : HELLO, WORLD 

由 输出 结果 看 到 ， 字 符 串 中 的 小 写字 母 全 部 转换 为 大 写字 母 了 。 

如 果 想 要 编写 “不 区 分 大 小 写 ” 的 代码 ， 就 可 以 使 用 upper 方法 。 如 果 想 要 在 一 个 字符 串 中 查 
找 某 个 子 字符 串 并 忽略 大 小 写 ， 也 可 以 使 用 upper 方法 ， 操 作 如 下 : 

>>> field='do it now'" 

>>> field.find('It') # 都 不 转换 为 大 写 ， 找 不 到 匹配 字符 串 

-1 


>>> field.upper() .find('It') # 被 查找 字符 串 不 转换 为 大 写 ， 找 不 到 匹配 字符 串 
ss 
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>>> field.upper() .find('It' .upper ()) # 使 用 upper 方法 转换 为 大 写 后 查找 
3 


由 输出 结果 看 到 ， 字 符 串 全 部 转换 为 大 写 后 能 找到 对 应 子 串 。 


4.3.5 ”swapcase() 方 法 


swapcase() 方 法 用 于 对 字符 串 的 大 小 写字 母 进行 转换 ， 将 字符 串 中 的 大 写字 母 转换 为 小 写 、 小 
写字 母 转换 为 大 写 。 

swapcase() 方 法 的 语法 如 下 : 

str.swapcase() 


此 语法 中 ，str 代表 指定 检索 的 字符 串 ， 该 方法 不 需要 参数 。 返 回 结果 为 大 小 写字 母 转换 后 生 
成 的 新 字符 串 。 

该 方法 使 用 示例 如 下 : 

>>> field='Just do it,NOW' 

>>> print (' 原 字符 串 : ', field) 

原 字符 串 : Just do it,NOW 

>>> print(' 调 用 swapcase 方法 后 得 到 的 字符 串 :' ,field.swapcase ()) 

调用 swapcase 方法 后 得 到 的 字符 串 : jUST DO IT, now 

由 输出 结果 看 到 ， 调 用 该 方法 后 ， 输 出 结果 中 的 大 写字 母 变 为 小 号、 小 写字 母 变 为 大 写 。 该 
方法 进行 大 小 写 转换 非常 方便 。 





4.3.6 replace() 方 法 


replace() 方 法 把 字符 串 中 的 old〈 旧 字符 串 ) 蔡 换 成 new (新 字符 串 ) ， 如 果 指 定 第 3 个 参数 
max， 替 换 次 数 就 不 超过 max 次 。 
replace() 方 法 的 语法 如 下 : 


str.replace(old, new[, max]) 


此 语法 中 ，str 代表 指定 检索 的 字符 串 ; old 代表 将 被 替换 的 子 字 符 串 ; new 代表 新 字符 串 ， 用 
于 替换 old 子 字符 串 ，max 代表 可 选 字符 串 ， 蔡 换 次 数 不 超 过 max 次 。 返 回 结果 为 字符 串 中 的 old 
〈 旧 字符 串 ) 蔡 换 成 new《〈 新 字符 串 ) 后 生成 的 新 字符 串 ， 如 果 指 定 第 3 个 参数 max， 替 换 次 数 就 
不 超过 max 次 。 

该 方法 使 用 示例 如 下 : 


>>> field='do it now,do right now' 

>>> print(' 原 字符 串 : ', field) 

原 字符 串 : do it now,do right now 

>>> Print (" 新 字符 串 : ' field.replace('do','Just do')) 
新 字符 串 : Just do it nowr Just do right now 

>>> print('" 新 字符 串 : ', field.replace('o', 'Just',1)) 
新 字符 串 : ddJust it now,do right now 

>>> print(' 新 字符 串 : ', field.replace('o'v'Just'v2)) 
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新 字符 串 : adJust it ngustw,do right now 
>>> print(" 新 字符 串 ，'， field.replace('o', 'Just',3)) 
新 字符 串 : dJust it nJustw,dJust right now 


由 上 面 的 输出 结果 看 到 ， 当 不 指定 第 3 个 参数 时 ， 所 有 匹配 字符 都 蔡 换 ， 指定 第 3 个 参数 时 ， 
蔡 换 从 左 往 右 进行 ， 蔡 换 次 数 不 超过 指定 次 数 。 


4.3.7 split() 方 法 


split() 方 法 通过 指定 分 隔 符 对 字符 串 进行 切片 ， 如 果 参 数 num 有 指定 值 ， 就 只 分 隔 num 个 子 
字符 串 。 这 是 一 个 非常 重要 的 字符 串 方法 ， 是 join 的 逆 方法 ， 用 来 将 字符 串 分 割 成 序列 。 
split() 方 法 的 语法 如 下 : 





str.split(st="", num=string.count(str)) 


此 语法 中 ，str 代表 指定 检索 的 字符 串 ，st 代表 分 隔 符 ， 默 认为 空格 ，num 代表 分 割 次 数 。 返 
回 结果 为 分 割 后 的 字符 串 列 表 。 

该 方法 使 用 示例 如 下 : 

>>> field='do it now' 

>>> print(' 不 提供 任何 分 割 符 分 隔 后 的 字符 串 : '，, field. split ()) 

不 提供 任何 分 割 符 分 隔 后 的 字符 串 : ['do'，'it'，'now'] 

>>> Print(" 根 据 i 分 隔 后 的 字符 串 : ', field.split ('i')) 

根据 i 分 隔 后 的 字符 串 : ["do '，'t now'] 

>>> print(' 根 据 o 分 隔 后 的 字符 串 : ' ,field.split ('0')) 

根据 o 分 隔 后 的 字符 串 :， ['"d'，' it n'，'w'] 

>>> print(' 根 据 o 分 隔 1 次 后 的 字符 串 : ', field.split("o'v1)) 

根据 o 分 隔 1 次 后 的 字符 串 : ['d'，' it now'] 

由 输出 结果 看 到 ， 如 果 不 提供 分 隔 符 ， 程 序 就 会 把 所 有 空格 作为 分 割 符 。 操 作 中 可 以 指定 分 
隔 符 和 分 割 次 数 ， 若 指定 分 割 次 数 , 则 从 左 往 右 检索 和 分 隔 符 匹 配 的 字符 ， 分 割 次 数 不 超 过 指定 次 
数 ， 若 不 指定 分 割 次 数 ， 则 所 有 匹配 的 字符 都 会 被 分 割 。 


4.3.8 strip() 方 法 


strip() 方 法 用 于 移 除 字符 串 头 尾 指定 的 字符 〈 默 认为 空格 ) 。 
strip0 方 法 的 语法 如 下 : 


str.strip([chars]) 


此 语法 中 ，str 代表 指定 检索 的 字符 串 ，chars 代表 移 除 字符 串 头 尾 指定 的 字符 。 返 回 结果 为 移 
除 字符 串 头 尾 指定 的 字符 生成 的 新 字符 串 。 

该 方法 使 用 示例 如 下 : 

>>> Fields"====00 4t noW====" 

>>> print(' 原 字符 串 : ', field) 


原 字 符 串 : ----do it now---- 
>>> Print(" 新 字符 串 : ', field.strip('"-')) 











新 字符 串 : do it now 


2 
>>> print(' 原 字符 串 : '，, st) 
原 字符 串 : ----do 一 it 一 now---- 


>>> print (' 新 字符 串 : ',st.strip('-')) 
新 字符 串 ， do -- it -- now 


由 操作 结果 看 到 ，strip 方法 只 去 除 头 尾 匹 配 的 字符 ， 中 间 匹 配 的 字符 不 会 去 除 。 


4.3.9 translate() 方 法 


translate() 方 法 根据 参数 table 给 出 的 表 (包含 256 个 字符 ) 转换 字符 串 的 字符 ， 将 要 过 滤 掉 的 
字符 放 到 del 参数 中 。 
translate() 方 法 的 语法 如 下 : 


str.translate(table[, deletechars]) 


此 语法 中 ，str 代表 指定 检索 的 字符 串 ，table 代表 翻译 表 ， 翻 译 表 通过 maketrans 方法 转换 而 
来 ;deletechars 代表 字符 串 中 要 过 滤 的 字符 列表 。 返 回 结果 为 翻译 后 的 字符 串 。 

该 方法 使 用 示例 如 下 : 

>>> intab='adefs' 

>>> outtab="'12345"' 

>>> trantab=str.maketrans (intab,outtab) 

>>> st='just do it' 

>>> print('st 调用 translate 方法 后 : ',st.translate (trantab) ) 

st 调用 translate 方法 后 : ju5t 2o 让 

由 输出 结果 看 到 ， 有 几 个 字符 被 蔡 换 成 数字 了 ， 被 蔡 换 的 字符 既 在 intab 变量 中 ， 又 在 st 变量 
中 ， 如 图 4-1 所 示 。 对 于 既 在 intab 中 ， 又 在 st 中 的 字符 ， 使 用 outtab 中 对 应 的 字符 替换 。 由 图 4-1 
可 知 ，intab 中 的 字符 d 对 应 outtab 中 的 字符 2、 字 符 s 对 应 字符 5， 所 以 最 后 输出 字符 串 中 的 s 被 
蔡 换 成 5、d 被 蔡 换 成 2， 这 样 就 得 到 了 最 后 我 们 看 到 的 字符 串 ju5t 2o it。 
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图 4-1 字符 串 对 应 关系 
translate 方法 和 replace 方法 一 样 ， 可 以 替换 字符 串 中 某 些 部 分 。 和 replace 方法 不 同 的 是 ， 


translate 方法 只 处 理 单个 字符 。translate 方法 的 优势 在 于 可 以 同时 进行 多 个 替换 ， 有 时 比 replace 方 
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4.4 “牛刀 小 试 一 一 变形 金刚 


已 知 一 个 字符 hello， 运 用 前 面 所 学 的 知识 并 结合 网 络 资源 ， 打 印 如 下 结果 
(1) hello 的 字符 串 长 度 ; (2) HELLO; (3) Hello; (4) hEllo; (5) HeLLO; (6) hllo。 
示例 如 下 ， 此 处 将 使 用 第 7 章 才 讲解 的 str_transformers() 函 数 来 实现 : 


>>> def str transformers () : 
old_str = 'hello' 
print('the length of old str is:', len(old str)) 
Print('upper old str is:', old str.upper()) 
print('title old str is:', old str.title()) 
new_ str = old str.replace('e', 'E') 
print('new str is:', new str) 
print('swap case new str is:', new str.swapcase()) 
print('use \',\' join olqd str is:',','.join(old str.split('e'))) 


>>> str transformers() 


打印 结果 如 下 : 


>>> str transformers() 

the length of old str is: 5 
upper old str is: HELLO 

title old str is: Hello 

new str is: hEllo 

swap case new str is: HeLLO 
use ',' join old str is: h,llo 


4.5 调 试 


这 里 通过 设置 一 些 错误 让 读者 认识 在 编写 代码 过 程 中 的 常见 问题 ， 以 帮助 读者 熟悉 和 解决 实 
际遇 到 的 问题 。 
(1) 使 用 格式 化 整数 的 占 位 符 格式 化 字符 串 ， 例 如 : 


>>> print ('hello,%d' % "world') 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: %d format: a number is required, not str 


输出 结果 告诉 我 们 需要 一 个 数字 ， 而 不 是 字符 串 。 
(2) 在 使 用 %f 输 出 圆周 率 的 示例 中 ， 若 更 改 为 使 用 %d 输出 ， 结 果 会 怎样 ? 输入 如 下 : 


>>> print (' 圆 周 率 PI 的 值 为 : sd' $$ 3.14) 
圆周 率 PI 的 值 为 : 3 


结果 把 小 数 点 后 的 数值 都 抛弃 了 。 
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(3) 在 用 0 填充 的 示例 中 ， 把 010 的 第 一 个 0 更 改 为 其 他 数字 ， 看 看 输出 结果 。 再 在 精度 之 
前 添加 一 个 0 或 大 于 0、 小 于 0 的 数字 ， 看 看 输出 结果 。 
>>> print (" 圆 周 率 PI 的 值 为 : $06.2f' % 3.141593) 
圆周 率 PI 的 值 为 : 003.14 
>>> print (' 圆 周 率 PI 的 值 为 : $16.2f' % 3.141593) 
圆周 率 PI 的 值 为 : Gi 
>>> print (' 圆 周 率 PI 的 值 为 : %.02f' % 3.141593) 
圆周 率 PI 的 值 为 : 3.14 
>>> print (' 圆 周 率 PI 的 值 为 : $.12f' % 3.141593) 
圆周 率 PI 的 值 为 : 3.141593000000 
>>> print (" 圆 周 率 PI 的 值 为 : $.-12f' % 3.141593) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ValueError: unsupported format character '-' (0x2d) at index 11 


由 输出 结果 看 到 ， 将 宽度 前 面 的 0 更 改 为 其 他 数字 会 认 作 宽度 值 ， 而 不 是 填充 值 。 在 精度 前 
面 加 0 对 结果 没有 影响 ， 若 添加 大 于 0 的 数字 ， 则 作为 小 数 的 实际 位 数 输出 ， 位 数 不 够 后 面 补 0; 
若 添加 小 于 0 的 数字 ， 则 报 异常 。 


4.6 ”问题 解答 


(1) 字符 串 格式 化 在 项 目 实战 中 一 般 用 于 做 什么 ? 

答 : 一 般 用 于 输入 信息 的 格式 化 ， 比 如 程序 中 的 查询 语句 ， 经 常 需 要 查看 一 个 查询 语句 查找 
到 了 多 少 记 录 。 对 于 我 们 而 言 ， 不 可 能 每 次 都 手动 执行 查询 语句 ， 这 时 就 可 以 用 字符 串 格式 化 语句 
将 查询 结果 格式 化 到 字符 串 中 ， 我 们 查看 输出 结果 即 可 。 

(2) 本 章 中 列举 的 字符 串 方法 很 常用 吗 ? 

答 : 这 个 要 看 接触 的 是 什么 样 的 工作 内 容 ， 基 本 上 都 会 经 常用 到 ， 这 也 是 大 家 在 使 用 过 程 中 
慢 慢 发 现 的 ， 是 基于 实战 经 验 的 积累 ， 在 平时 使 用 频率 都 比较 高 。 当 然 ， 有 一 些 这 里 没有 列举 出 来 
的 方法 ， 在 实际 使 用 中 也 会 经 常用 到 ， 大 家 用 到 时 可 以 自己 查看 相关 资料 。 


4.7 温 故 知 新 ， 学 以 致 用 


本 章 主 要 讲解 了 字符 串 ， 在 本 章 结 束 前 回顾 一 下 学 到 的 概念 。 


(1) 字符 串 有 哪些 基本 操作 ? 
(2) 字符 串 格式 化 的 方式 有 哪些 ? 
(3) 字符 串 比 较 常 用 的 方法 有 哪些 ， 该 怎么 使 用 ? 


尝试 思考 并 解决 如 下 问题 : 
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(1) 自 定义 一 个 字符 串 ， 并 做 字符 串 的 格式 化 输出 。 

(2) 自 定义 一 个 变量 ， 实 现 整数 、 浮 点 数 等 的 格式 化 输出 。 

(3) 定义 一 个 变量 ， 做 格式 化 输出 的 对 齐 ， 对 不 齐 的 部 分 用 空格 或 其 他 对 应 符号 填充 。 

(4) 使 用 find0 和 index() 方 法 对 字符 串 进行 索引 ， 比 对 两 者 的 异同 。 

(5) 使 用 join() 方 法 实现 多 个 字符 串 的 连接 。 

(6) 定义 一 个 变量 ， 将 变量 中 的 大 写字 母 转化 为 小 写字 母 、 小 写字 母 转化 为 大 写字 母 。 

(7) 定义 一 个 变量 ， 对 变量 特定 位 置 的 字符 进行 替换 。 

(8) 定义 一 个 变量 ， 对 变量 按 指 定 字符 分 割 ， 之 后 将 分 割 结果 按 指 定 字 符 连 接 。 

(9) 小 智 的 智商 从 去 年 的 100 分 提升 到 了 今年 的 132 分 ， 请 计算 小 智 智商 提升 的 百分比 ， 并 
用 字符 串 格式 化 显示 出 “xx.x%” 的 形式 ， 保 留 一 位 小 数 。 

(10) 尝试 将 本 章 中 示例 用 到 的 % 都 换 成 带 了 ?前 绥 的 形式 做 格式 化 输出 。 
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通过 第 3 章 对 列表 的 学 习 ， 我 们 了 解 到 列表 可 以 将 值 分 组 到 一 个 结构 中 ， 并 通过 编号 进行 引用 。 

本 章 将 介绍 一 种 通过 名 字 引 用 值 的 数据 结构 ， 这 种 结构 类 型 称 为 映射 《mapping) 。 字 典 是 
Python 中 唯一 内 建 的 映射 类 型 ， 字 典 指定 值 并 没有 特殊 顺序 ， 都 存储 在 一 个 特殊 的 键 (Key) 里 ， 
键 可 以 是 数字 、 字 符 串 或 元 组 。 

字典 是 另 一 种 可 变 容器 模型 ， 可 存储 任意 类 型 的 对 象 。 


5.1 字典 的 使 用 


字典 数据 结构 的 功能 就 跟 它 的 名 字 一 样 ， 可 以 像 《 汉 语 字典 》 一 样 使 用 。 在 使 用 汉语 字典 时 ， 
我 们 可 以 从 头 到 尾 一 页 一 页 查找 某 个 字 , 也 可 以 通过 拼音 索引 或 笔画 索引 快速 找到 某 个 字 , 在 汉语 
字典 中 找 拼音 索引 和 笔画 索引 非常 轻松 简单 。 

在 Python 中 对 字典 进行 了 构造 ， 让 我 们 可 以 轻松 查 到 某 个 特定 的 键 〈 类 似 拼音 或 笔画 索引 ) ， 
从 而 通过 键 找到 对 应 的 值 《类似 具 体 某 个 字 ) 。 

假如 需要 创建 一 个 可 以 存储 学 生 姓名 和 学 号 的 小 型 数据 库 ， 应 该 怎么 做 呢 ? 我们 尝试 使 用 之 
前 学 习 过 的 列表 实现 ， 例 如 : 

>>> students=[' 小 荫 ', ' 小 智 ', ' 小 强 ',' 小 张 ',' 小 李 '] 

>>> numbers=['1001','1002','1003', '1004', '1005"] 

>>> print(' 小 智 的 学 号 是 :', numbers[students.index(' 小 智 ') ]) 

小 智 的 学 号 是 : 1002 

输出 结果 是 我 们 想 要 的 ， 但 是 当 数 据 量 比较 大 时 ， 显 然 不 适用 。 数 据 量 比较 大 时 ， 意 味 着 要 
对 学 生 姓 名 列表 创建 一 个 有 同样 多 元 素 的 学 号 列表 , 一 旦 列表 发 生变 更 , 就 要 将 学 号 列表 和 学 生 姓 
名 列表 进行 逐步 比 对 ， 以 进行 相应 变更 。 

我 们 想 要 的 真正 效果 是 像 使 用 index 方法 一 样 ，index 返回 的 是 索引 位 置 ， 我 们 希望 直接 返 





互 
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索引 位 置 上 的 值 ， 比 如 : 

>>> print (' 小 智 的 学 号 是 :', numbers[' 小 智 ']) 

小 智 的 学 号 是 : 1002 

这 种 方式 可 以 实现 ， 如 果 numbers 是 字典 ， 就 可 以 这 么 操作 并 得 到 结果 ， 具 体 可 以 查看 5.2 节 
的 讲解 。 


5.2 ”创建 和 使 用 字典 


字典 的 创建 格式 如 下 : 
>>> d = {keyl : valuel, key2 : value2 } 


字典 由 多 个 键 及 其 对 应 的 值 构成 的 对 组 成 (把 键 / 值 对 称 为 项 ) 。 字 典 的 每 个 键 / 值 (key/value) 
对 用 冒号 (:) 分 割 ， 每 个 项 之 间 用 逗号 (，) 分 割 ， 整 个 字典 包括 在 花 括 号 ({}) 中 。 空 字典 不 
包括 任何 项 ) 由 两 个 大 括号 组 成 ， 如 {}。 

键 必须 是 唯一 的 ， 但 值 不 必 。 值 可 以 取 任 何 数据 类 型 ， 键 必须 是 不 可 变 的 ， 如 字符 串 、 数 字 
或 元 组 。 

下 面 是 一 个 简单 的 字典 示例 : 

>>> dict_val = {' 小 彰 ' : '1001'，' 小 智 ': '1002'，' 小 强 ': '1003'} 

也 可 以 为 如 下 形式 : 


>>> dict1l = { 'abc': 456 } 
>>> dict2 = { 'abc': 123, 98.6: 37 } 


5.2.1 dict 函数 


可 以 用 dict 函数 通过 其 他 映射 (如 其 他 字典 ) 或 键 / 值 序列 对 建立 字典 ， 例 如 : 


>>> student=[('name', ' 小 萌 ')，, ('number', '1001')] 
>>> detail=dict (student) 

>>> print(' 学 生 详细 信息 : ', detail) 

学 生 详细 信息 : {'name' : ' 小 萌 '，'number': '1001'} 
>>> print(' 学 生 姓名 : ', detail['name']) 


学 生 姓名 小 戎 

>>> print(' 学 生 学 号 : ', detail['number']) 

学 生 学 号 : 1001 

由 输出 结果 看 到 ，dict 函数 可 以 将 序列 转换 为 字典 。 字 典 的 操作 很 简单 ， 在 5.1 节 期 望 的 功能 
已 经 实现 了 。 


dict 函数 可 以 通过 关键 字 参 数 创建 字典 ， 例 如 : 


>>> detail=dict (name=' 小 智 ', number='1002') 
>>> print(' 学 生 详细 信息 : ', detail) 
学 生 详细 信息 : {'name' : ' 小 智 '，'number': '1002'} 





由 输出 结果 看 到 ， 通 过 关键 字 参 数 创 建 了 字典 。 
通过 关键 字 创 建 字典 是 dict 函数 非常 有 用 的 一 个 功能 ， 可 以 多 加 运用 。 


5.2.2 ”字典 的 基本 操作 


字典 的 基本 操作 在 很 多 方面 与 序列 (sequence) 类 似 ， 支 持 修改 、 删 除 等 操作 。 下 面 进行 具体 
的 讲解 。 

1. 修改 字典 

向 字典 添加 新 内 容 的 方法 是 增加 新 键 / 值 对 ， 修 改 或 删除 已 有 键 / 值 对 ， 例 如 : 

>>> student={ ' 小 萌 ' :'1001', ' 小 智 ':'1002', ' 小 强 ' :'1003'} 

>>> student [' 小 强 ']='1005' # 更 新 小 强 的 学 号 

>>> print(' 小 强 的 学 号 是 ，% (小 强 )s' $ student) 

小 强 的 学 号 是 : 1005 

>>> student [' 小 张 ']='1006' # 添 加 一 个 学 生 


>>> print(' 小 张 的 学 号 是 : %( 小 张 )s' % student) 
小 张 的 学 号 是 : 1006 


由 输出 结果 看 到 ， 修 改 和 添加 均 操作 成 功 。 
2. 删除 字典 元 素 
此 处 的 删除 指 的 是 显 式 删除 ， 显 式 删除 一 个 字典 用 del 命令 ， 例 如 : 


>>> student={ ' 小 强 ': '1005'，' 小 萌 ' : '1001'，' 小 智 ': '1002'，' 小 张 ': '10069) 
>>> print(' 删 除 前 : ', student) 

删除 前 : {' 小 强 ' : '1005'，' 小 萌 ': "'1001'，' 小 智 ': '1002'，' 小 张 ': '1006'} 

>>> del student[' 小 张 '] # 删 除 键 值 为 “小 张 ”的 键 

>>> print(' 删 除 后 :', student) 

删除 后 : {' 小 强 ' : '1005'，' 小 萌 ': '1001'，' 小 智 ': '1002'} 


由 输出 结果 看 到 对 应 键 / 值 被 正确 删除 了 。 

除了 删除 键 外 ， 还 可 以 删除 整个 字典 ， 例 如 : 

>>> student={ ' 小 强 ': '1005'，' 小 萌 ' : '1001'，' 小 智 ': '1002'，' 小 张 ': '1006'} 

>>> print('" 删 除 前 : student) 

删除 前 : { "小 强 ' : '1005'，' 小 萌 ': "1001'， "小 智 ': '1002'，' 小 张 ': '1006'} 

>>> del student # 删 除 字 典 

>>> print(' 删 除 后 : '，, student) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

NameError: name 'student' is not defined 

由 输出 结果 看 到 , 删除 字典 后 就 不 能 对 字典 进行 访问 了 , 因为 执行 del 操作 后 字典 就 不 存在 了 ， 
因而 会 报 变量 没有 定义 的 错误 。 

3. 字典 键 的 特性 

字典 值 可 以 没有 限制 地 取 任 何 Python 对 象 ， 既 可 以 是 标准 对 象 ， 也 可 以 是 用 户 定义 的 对 象 ， 
但 键 不 行 。 
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(1) 不 允许 同一 个 键 出 现 两 次 。 创 建 时 如 果 同 一 个 键 被 赋值 两 次 ， 后 面 的 值 会 被 记 住 


例如 : 
>>> student={ ' 小 萌 ' : '1001'，' 小 智 ': '1002'，' 小 萌 ': '1005"'} 
>>> Print(" 学 生 信息 : ', student) 
学 生 信息 : { "小 萌 ' : '1005'，' 小 智 ': '1002'} 
由 输出 结果 看 到 ， 一 个 键 被 赋值 两 次 ， 后 面 的 值 会 被 记 住 。 
(2) 键 必须 不 可 变 ， 可 以 用 数字 、 字 符 串 或 元 组 充当 ， 不 能 用 列表 ， 例 如 : 
>>> field={ [name'] :' 小 戎 ', 'number':'1001'} 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
TypeError: unhashable type: 'list' 


由 输出 结果 看 到 ， 不 能 用 列表 做 键 ， 否 则 会 提示 类 型 错误 。 
4. len 函数 
len (dict) 函数 用 于 计算 字典 元 素 的 个 数 ， 即 键 的 总 数 ， 例 如 : 


>>> student={ ' 小 萌 ' : '1001'，' 小 智 ': '1002' ，' 小 强 ': '1005',' 小 张 ': '1006'} 
>>> print(' 字 典 元 素 个 数 为 : %d 个 ' $ len(student)) 


字典 元 素 个 数 为 ，4 个 
输出 结果 得 到 字典 元 素 的 个 数 为 4。 
5. type 函数 


type (variable) 函数 返回 和 输入 的 变量 类 型 ， 如 果 输 入 的 变量 是 字典 ， 就 返回 字典 类 型 ， 例 如 : 





>>> student={ ' 小 萌 ! : '1001'，' 小 智 ': '1002!，' 小 强 ': '1005',' 小 张 ': '1006'} 
>>> print(' 字 典 的 类 型 为 ，', type (student)) 
字典 的 类 型 为 ， <class 'dict'> 


输出 结果 为 字典 〈dict) 类 型 。 


5.2.3 ”字典 的 格式 化 字符 串 


我 们 已 经 在 第 4 章 见 过 如 何 使 用 字符 串 格式 化 功能 格式 化 元 组 中 的 所 有 值 。 如果 使 用 字典 (只 


以 字符 串 作为 键 》 而 不 是 元 组 做 这 项 工作 ， 会 使 字符 串 格式 化 更 有 趣 一 些 ， 例 如 : 


>>> student={ "小 萌 ' :'1001', ' 小 智 ': '1002', ' 小 强 ' :'1003'} 
>>> print(' 小 强 的 学 号 是 : %( 小 强 )s' % student) 
小 强 的 学 号 是 ，1003 








由 操作 结果 看 到 ,字典 的 格式 化 方式 是 在 每 个 转换 说 明 符 中 的 % 字 符 后 加 上 用 











键 ， 再 跟 上 其 他 说 明 元 素 。 


括号 括 起 来 的 


字典 的 格式 化 除了 增加 字符 串 键 外 ， 转 换 说 明 符 还 像 以 前 一 样 工作 。 以 这 种 方式 使 用 字典 时 


只 要 所 有 给 出 的 键 都 能 在 字典 中 找到 ， 就 可 以 获得 任意 数量 的 转换 说 明 符 。 





5.2.4 字典 和 列表 的 区 别 


例如 ， 以 一 个 名 字 查 找 对 应 的 学 号 。 

如 果 用 list 实现 ， 就 要 先 在 名 字 列 表 中 找到 对 应 的 名 字 ， 再 从 学 号 列表 取出 对 应 的 学 号 ，list 
越 长 耗 时 越 长 。 如 果 用 dict 实现 , 只 需要 一 个 名 字 和 学 号 的 对 照 表 , 就 可 以 直接 根据 名 字 查 找 学 号 ， 
无 论 这 个 表 有 多 大 ， 查 找 速度 都 不 会 变 慢 。 

为 什么 dict 查找 速度 这 么 快 ? 

因为 dict 的 实现 原理 和 查 字典 一 样 。 假 设 字 典 包 含 10 000 个 汉字 ， 我 们 要 查 某 一 个 字 ， 一 种 
方法 是 把 字典 从 第 一 页 往 后 翻 ， 直 到 找到 我 们 想 要 的 字 为 止 ， 这 种 方法 是 在 list 中 查找 元 素 ，list 
越 大 查找 越 慢 。 另 一 种 方法 是 在 字典 的 索引 表 里 〈 如 部 首 表 ) 查 这 个 字 对 应 的 页 码 ， 然 后 直接 翻 到 
该 页 找到 这 个 字 。 无 论 找 哪个 字 ， 这 种 查找 速度 都 非常 快 ， 不 会 随 着 字典 大 小 的 增加 而 变 慢 。 

dict 就 是 第 二 种 实现 方法 ， 给 定 一 个 名 字 ， 比 如 我 们 要 查找 5.2.3 小 节 示例 中 “小 萌 ” 的 学 号 ， 
在 dict 内 部 就 可 以 直接 计算 出 “小 萌 ” 存 放学 号 的 “页 码 ”， 也 就 是 1001 存放 的 内 存 地 址 ， 直 接 
取出 来 即 可 ， 所 以 速度 非常 快 。 

综 上 所 述 ，list 和 dict 各 有 以 下 几 个 特点 。 


dict 的 特点 是 : 

(1) 查找 和 插入 的 速度 极 快 ， 不 会 随 着 key 的 增加 而 变 慢 。 
(2) 需要 占用 大 量 内 存 ， 内 存 浪费 多 。 

list 的 特点 是 : 
(1) 查找 和 插入 时 间 随 着 元 素 的 增加 而 增加 。 

(2) 占用 空间 小 ， 浪 费 内 存 很 少 。 

所 以 ，dict 是 使 用 空间 换取 时 间 。 

dict 可 以 用 在 很 多 需要 高 速 查找 的 地 方 ， 在 Python 代码 中 几乎 无 处 不 在 ， 正 确 使 用 dict 非常 








dict 内 部 存放 的 顺序 和 键 放 入 的 顺序 没有 关系 。 





5.3 字典 方法 


像 其 他 内 建 类 型 一 样 ， 字 典 也 有 方法 ， 这 些 方法 非常 有 用 ， 不 过 可 能 不 像 使 用 列表 或 字符 串 
一 样 频繁 使 用 。 学 习 本 节 时 可 以 先 简单 了 解 一 下 有 哪些 方法 可 以 使 用 , 然后 在 需要 时 回 过 头 来 查看 
特定 方法 的 具体 用 法 。 
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5.3.1 clear() 方 法 


clear() 方 法 用 于 删除 字典 内 的 所 有 项 。 
clear() 方 法 的 语法 如 下 : 


dict.clear() 
此 语法 中 ，dict 代表 指定 字典 ， 该 方法 不 需要 参数 。 该 函数 是 一 个 原 地 操作 (类似 于 list.sort) 


函数 ， 没 有 任何 返回 值 (返回 值 为 None) 。 
该 方法 使 用 示例 如 下 : 





由 输出 结果 可 知 ， 字 典 调用 clear 方法 后 整个 字典 内 所 有 项 都 被 删除 。 
下 面 看 两 个 示例 。 


示例 1: 





示例 2: 





两 个 示例 中 ,x 和 y 最 初 对 应 同一 个 字典 。 示 例 1 中 ,通过 将 x 关联 到 一 个 新 的 空 字典 对 它 重 
新 赋值 ， 这 对 y 没有 任何 影响 ， 还 关联 到 原先 的 字典 。 若 想 清空 原始 字典 中 所 有 元 素 ， 则 必须 使 用 
clear 方法 ， 使 用 clear 后 ，y 的 值 也 被 清空 了 。 





5.3.2 ”copy() 方 法 


copy() 方 法 返回 一 个 具有 相同 键 / 值 对 的 新 字典 。 这 个 方法 是 浅 复制 (shallow copy) ， 因 为 值 
本 身 是 相同 的 ， 而 不 是 副本 。 
copy0 方 法 的 语法 如 下 : 





dict.copy() 


此 语法 中 ，dict 代表 指定 字典 ， 该 方法 不 需要 参数 。 返 回 结果 为 一 个 字典 的 浅 复制 。 
该 方法 使 用 示例 如 下 : 


>>> student={ ' 小 萌 ' : '1001'，' 小 智 ': '1002' ，' 小 强 ': '1005', ' 小 张 ': '1006'} 

>>> st=student .copy() 

>>> print(' 复 制 后 得 到 的 st 为: "vst) 

复制 后 得 到 的 st 为 : {' 小 强 ': '1005'，' 小 萌 ' : '1001'，' 小 智 ': '1002'，' 小 张 ': '1006'} 


由 输出 结果 看 到 ， 使 用 copy 方法 可 以 将 字典 复制 给 另 一 个 变量 。 
我 们 可 以 通过 下 面 的 示例 了 解 什么 是 浅 复制 。 


>>> student={' 小 智 ': '1002'，'info':[' 小 张 ', '1006', 'man']} 
>>> st=student .copy() 

>>> st[' 小 智 ']='1005' 

>>> print(' 更 改 copy 后 的 st 为 : '，, st) 

更 改 copy 后 的 st 为 。 {'info' : [' 小 张 '，'1006'，'man'] ，' 小 智 ': '1005'} 
>>> print(' 原 字符 串 为 :: ', student) 

原 字符 串 为 :: {'info': [' 小 张 '，'1006'，'man']，' 小 智 ': '1002'} 
>>> st['info'] .remove('man') 

>>> print(' 删 除 后 st 为 :'，, st) 

删除 后 st 为 。 {'info' : [' 小 张 '，'1006'] ，' 小 智 ': '1005'} 

>>> print(' 删 除 后 student 为 : ' ,student) 

删除 后 student 为 : {'info': [' 小 张 '"，'1006'] ，' 小 智 ': '1002'} 


由 输出 结果 看 到 ， 替 换 副 本 的 值 时 原始 字典 不 受 影响 。 如 果 修改 了 某 个 值 ( 原 地 修改 ， 不 是 
替换 ) ， 原 始 字 典 就 会 改变 ， 因 为 同样 的 值 也 在 原 字 典 中 。 以 这 种 方式 进行 复制 就 是 浅 复制 ， 而 使 
用 深 复 制 (deep copy) 可 以 避免 该 问题 ， 此 处 不 做 讲解 ， 有 兴趣 的 读者 可 以 自己 查找 相关 资料 。 





5.3.3 ”fromkeys() 方 法 


fromkeys() 方 法 用 于 创建 一 个 新 字典 。 

fromkeys() 方 法 的 语法 如 下 : 

dict.fromkeys(seq[, value])) 

此 语法 中 ,dict 代表 指定 字典 ; seq 代表 字典 键 值 列 表 ; value 代表 可 选 参 数 , 设置 键 序列 (seq) 
的 值 。 该 方法 返回 结果 为 列表 。 

该 方法 使 用 示例 如 下 : 


>>> seq = ('name', 'age', 'sex') 
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>>> info = dict.fromkeys (seq) 

>>> print ("新 的 字典 为 : ss" % info) 

新 的 字典 为 : {'name': None, 'sex': None, 'age': None} 
>>> info = dict.fromkeys (seq, 10) 

>>> print ("新 的 字典 为 : %s" $ info) 

新 的 字典 为 : {'name': 10, 'sex': 10，'age': 10} 


由 输出 结果 看 出 ，fromkeys 方法 使 用 给 定 的 键 建立 新 字典 ， 每 个 键 默 认 对 应 的 值 为 None。 


5.3.4 get() 方 法 


返回 








get() 方 法 返回 指定 键 的 值 ， 如 果 值 不 在 字典 中 ， 就 返回 默认 值 。 
get() 方 法 的 语法 如 下 : 


dict.get(key, default=None) 


此 语法 中 ，dict 代表 指定 字典 ，key 代表 字典 中 要 查找 的 键 ，default 代表 指定 键 的 值 不 存在 时 
默认 值 。 该 方法 返回 结果 为 指定 键 的 值 ， 如 果 值 不 在 字典 中 ， 就 返回 默认 值 None。 
该 方法 使 用 示例 如 下 : 


>>> student={ ' 小 萌 ' : '1001'，' 小 智 ': '1002'} 
>>> print (" 小 萌 的 学 号 为 : %s' % student.get(' 小 萌 ')) 
小 萌 的 学 号 为 : 1001 


由 输出 结果 看 到 ，get 方法 使 用 起 来 比较 简单 。 再 看 如 下 示例 : 


>>> st={} 
>>> print(st['name']) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
KeyError: "name'" 
>>> Print(st.get('name')) 
None 
>>> print('name 的 值 为 : %s' % st.get('name')) 
name 的 值 为 ， None 


由 输出 结果 看 到 ， 以 其 他 方法 试图 访问 字典 中 不 存在 的 项 时 会 出 错 ， 而 使 用 get 方法 就 不 会 。 使 





用 get 方法 访问 一 个 不 存在 的 键 时 ， 返 回 None。 这 里 可 以 自 定义 默认 值 ， 用 于 替换 None， 例 如 : 





>>> st={} 
>>> print('name 的 值 为 : ss' % st.get('name',' 未 指定 ')) 
name 的 值 为 :未 指定 


由 输出 结果 看 到 ， 输 出 结果 中 用 “未 指定 ”替代 了 None。 


5.3.5 ”key in dict 方法 


返回 





Python 字典 in 操作 符 用 于 判断 键 是 否 存在 于 字典 中 ， 如 果 键 在 字典 dict 中 就 返回 tue， 否 则 
false。 


该 方法 的 语法 如 下 : 








key in dict 


此 语法 中 ，dict 代表 指定 字典 ，key 代表 要 在 字典 中 查找 的 键 。 如 果 键 在 字典 里 就 返回 true， 
否则 返回 false。 

该 方法 使 用 示例 如 下 : 

>>> student={ ' 小 萌 ' : '1001'，' 小 智 ': '1002'} 

>>> print('" 小 萌 在 student 字典 中 : %s'%(' 小 戎 ' in stugent)) 

小 萌 在 student 字典 中 : True 

>>> print(' 小 强 在 student 字典 中 : $s'%(' 小 强 ' in student) ) 

小 强 在 student 字典 中 :False 

由 输出 结果 看 到 ， 已 返回 对 应 的 True 或 False。 

该 方法 是 Python 3 中 的 方法 。 在 Python 2 中 有 一 个 有 相同 功能 的 方法 一 一 has_key 方 法 ,has_key 
方法 的 使 用 方式 和 in 不 同 。 








5.3.6 items() 方 法 


items() 方 法 以 列表 返回 可 遍历 的 〈 键 / 值 ) 元 组 数组 。 

items() 方 法 的 语法 如 下 : 

dict.items() 

此 语法 中 ，dict 代表 指定 字典 ， 该 方法 不 需要 参数 。 返 回 结 果 为 可 遍历 的 ( 键 / 值 ) 元 组 数组 。 

该 方法 使 用 示例 如 下 : 

>>> student={ ' 小 萌 ' : '1001'，' 小 智 ': '1002'} 

>>> print(' 调 用 items 方法 的 结果 : %s'% student .items () ) 

调用 items 方法 的 结果 : dict_items([(" 小 萌 '，'1001')，(" 小 智 '， "10027)]) 

由 输出 结果 看 到 ， 返 回 结果 为 一 个 元 组 数组 。 

在 Python 2 中 提供 了 一 个 iteritems 方法 ， 该 方法 和 items 方法 的 作用 大 致 相同 ， 但 是 iteritems 
方法 返回 的 是 一 个 迭代 器 对 象 ， 而 不 是 列表 。 在 Python 3 中 没有 iteritems 方法 。 





5.3.7 keys() 方 法 


keys() 方 法 以 列表 返回 一 个 字典 的 所 有 键 。 

keys() 方 法 的 语法 如 下 : 

dict.keys() 

此 语法 中 ，dict 代表 指定 字典 ， 该 方法 不 需要 参数 。 返 回 结果 为 一 个 字典 的 所 有 键 。 
该 方法 使 用 示例 如 下 : 


>>> student={ "小 萌 ': '1001'，' 小 智 ': '1002'} 
>>> print(' 字 典 student 所 有 键 为 : $s'% student .keys()) 
字典 student 所 有 键 为 : dict_keys ([' 小 萌 '，' 小 智 '] ) 
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由 输出 结果 看 到 ， 返 回 的 是 一 个 元 组 数组 ， 数 组 中 包含 字典 的 所 有 键 。 


3.8 setdefault() 方 法 





setdefault() 方 法 和 get() 方 法 类 似 ， 用 于 获得 与 给 定 键 相 关联 的 值 。 如 果 键 不 存在 于 字典 中 ， 就 


会 添加 键 并 将 值 设 为 默认 值 。 


该 


回 
定 





setdefault() 方 法 的 语法 如 下 : 

dict.setdefault(key, default=None) 

此 语法 中 ,dict 代表 指定 字典 ,key 代表 查找 的 键 值 ，default 代表 键 不 存在 时 设置 的 默认 键 值 。 
方法 没有 任何 返回 值 。 

该 方法 使 用 示例 如 下 : 

>>> student={ ' 小 萌 ': '1001'，' 小 智 ': '1002'} 

>>> print(' 小 强 的 键 值 为 。%$s'% student.setdefault(' 小 强 ')) 

小 强 的 键 值 为 ， None 

>>> print(' 小 智 的 键 值 为 %s'% student.setdefault(' 小 智 ')) 

小 智 的 键 值 为 ，1002 

>>> print ('student 字典 新 值 为 ，%s'% student) 

student 字典 新 值 为 : { ' 小 强 ' : None， ' 小 萌 ': '1001'，' 小 智 ': '1002'} 

由 输出 结果 看 到 ， 当 键 不 存在 时 ，setdefault 方法 返回 默认 值 并 更 新 字典 ， 如 果 键 存在 ， 就 返 
与 其 对 应 的 值 ， 不 改变 字典 。 和 get 一 样 ， 默 认 值 可 以 选择 ， 如 果 不 设 定 就 使 用 None， 如 果 设 
就 使 用 设 定 的 值 ， 例 如 : 


>>> student={' 小 萌 ': '1001'，' 小 智 ': '1002'} 

>>> print(' 小 强 的 键 值 为 %s'% student.setdefault(' 小 强 ')) 

小 强 的 键 值 为 ， None 

>>> print(' 小 zhang 的 键 值 为 : $s'% student .setdefault (' 小 zhang','1006')) 
小 zhang 的 键 值 为 : 1006 


由 输出 结果 看 到 ， 小 强 没有 设置 值 ， 使 用 的 是 默认 值 ， 输 出 键 值 为 None; 小 zhang 设置 的 默 


认 值 是 1006， 输 出 键 值 为 1006。 


5 





.3.9 update() 方 法 


update() 方 法 用 于 把 字典 dict2 的 键 / 值 对 更 新 到 dict 里 。 

update() 方 法 的 语法 如 下 : 

dict.update(dict2) 

此 语法 中 ，dict 代表 指定 字典 ，dict2 代表 添加 到 指定 字典 dict 里 的 字典 。 该 方法 没有 任何 返 
值 。 

该 方法 使 用 示例 如 下 : 


>>> student={ ' 小 萌 ' : '1001'，' 小 智 ': '1002'} 
>>> student2={ ' 小 李 ' :'1003'} 





>>> print(' 原 student 字典 为 : $s'% student) 

原 student 字典 为 : { "小 萌 ' : '1001' ，' 小 智 ': '1002'} 

>>> student .update (student2) 

>>> print(' 新 student 字典 为 : $s'% student) 

新 student 字典 为 : { "小 李 ' : '1003' ，' 小 萌 ': '1001'，' 小 智 ': '1002'} 
>>> student3={ ' 小 李 ' :'1005'} 

>>> student .update (student3) # 对 相同 项 覆盖 

>>> print(' 新 student 字典 为 : $s'% student) 

新 student 字典 为 ，{ "小 李 ' : '1005'， ' 小 萌 ': '1001'，' 小 智 ': '1002'} 


由 输出 结果 看 到 ， 提 供 的 字典 中 的 项 被 添加 到 旧 字典 中 ， 如 果 有 相同 的 键 就 会 覆盖 。 


5.3.10 values() 方 法 





values() 方 法 以 列表 形式 返回 字典 中 的 所 有 值 。 与 返回 键 的 列表 不 同 ， 返 回 的 列表 中 可 以 包含 





外 复 的 元 素 。 


values() 方 法 的 语法 如 下 : 

dict.values() 

此 语法 中 ，dict 代表 指定 字典 ， 该 方法 不 需要 参数 。 返 回 结果 为 字典 中 的 所 有 值 。 
该 方法 使 用 示例 如 下 : 

>>> student={ ' 小 萌 '! : '1001'，' 小 智 ': '1002', ' 小 李 ' :'1001'} 


>>> print('student 字典 所 有 值 为 : $s'% list (student .values ())) 
student 字典 所 有 值 为 ，['1001'，"'1001'，'1002'] 


由 输出 结果 看 到 ， 返 回 的 列表 中 包含 重复 的 元 素 。 








5.4 ”牛刀 小 试 一 一 字典 合并 与 排序 


有 两 个 字典 ， 先 将 字典 合并 ， 完 成 后 对 合并 的 字典 进行 排序 。 
大 体 思路 : 
(1) 借助 字典 的 update 函数 将 字典 合并 。 


(3) 将 转化 后 的 列表 进行 排序 知识 点 列表 排序 ) 。 
(4) 将 排序 好 的 列表 转化 为 字典 (知识 点 : 列表 转化 为 字典 ) 。 
具体 实现 如 下 : 


>>> def merge range(): 
lan ver = {"lan": "python", "v": "3.7"} 
rea ai = {"why": "hobby", "how": "do"} 
d merge = dict() 
d_merge.update (lan ver) 
d_merge.update (rea ai) 
desc list = sorted(dt21s (d merge), key=lambda x:x[0], reverse=True) 
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desc dict = dict(desc list) 
asc_ list = sorted(dt21s(d merge), key=lambda x:x[0], reverse=False) 
asc dict = dict(asc list) 
print (f' 合 并 后 的 结果 : {a_merge}') 
print (f' 按 照 第 0 个 元 素 降序 排列 : {desc_qdict}' ) 
print (f' 按 照 第 0 个 元 素 升序 排列 : {asc_ dict}' ) 


>>> def dt21s (dic:dict) : 
""w 将 字典 转化 为 列表 """ 
keys = dic.keys () 
values = dic.values() 
lst = [(key, val) for key, val in zip(keys, values)] 
return lst 


>>> merge_range() 


输出 结果 : 


合并 后 的 结果 : {'lan': 'python', 'v': '3.7', 'why': 'hobby', 'how': 'do'} 
按照 第 0 个 元 素 降序 排列 : {'why': 'hobby'，'v': '3.7', 'lan': 'python', 'how': 'do'} 
按照 第 0 个 元 素 升序 排列 : {'how': 'do'，'lan': 'python'，'v': '3.7', 'why': 'hobby'} 








5.5 调 试 


下 面 我 们 通过 示例 进行 介绍 ， 这 里 通过 设置 一 些 错误 让 读者 认识 在 编写 代码 过 程 中 的 常见 问 
题 ， 以 帮助 读者 熟悉 和 解决 实际 遇 到 的 问题 。 


(1) 使 用 列表 根据 姓名 查找 学 号 ， 学 号 使 用 字符 串 表 示 ， 如 果 更 改 为 使 用 数字 表示 会 如 何 ? 

例如 : 

>>> students=[' 小 萌 ', ' 小 智 ', ' 小 强 ',' 小 张 ',' 小 李 '] 

>>> numbers=[1001,1002,1003,1004, 1005] 

>>> print(' 小 智 的 学 号 是 ，', numbers[students.index(' 小 智 ') ]) 

小 智 的 学 号 是 : 1002 

输出 结果 和 使 用 字符 串 表 示 的 输出 结果 没有 什么 不 同 。 不 过 这 里 数字 都 是 以 1 开头 的 , 若 把 1 
更 改 为 0， 我 们 试 试 : 

>>> students=[' 小 萌 ',' 小 智 ',' 小 强 ',' 小 张 ',' 小 李 '] 

>>> numbers=[0001,0002,0003,0004,0005] 

SyntaxError: invalid token 

可 以 看 出 ，numbers 编译 不 通过 ， 告 诉 我 们 这 是 一 个 无 效 标 记 。 这 就 是 不 使 用 数字 而 使 用 字符 
的 原因 ， 使 用 数字 碰 到 以 0 开头 的 数字 就 会 出 现 问 题 。 

(2) 尝试 从 字典 中 输出 一 个 字符 宽度 为 10 的 元 素 ， 例 如 : 

>>> student={' 小 萌 ' :'1001', ' 小 智 ':'1002', "小 强 ' :'1003'} 


>>> print(' 小 萌 的 学 号 是 : % (小 荫 )10s' % student) # 字 符 宽度 为 10 
小 萌 的 学 号 是 : 1001 


尝试 把 10s 变换 为 10d、10f、-10s、+10s， 看 看 输出 结果 是 怎样 的 。 





HR 





5.6 ”问题 解答 


(1) 在 项 目 实战 中 字典 用 得 多 吗 ? 

答 : 在 实际 项 目 中 字典 用 得 比较 多 。 通 过 本 章 的 学 习 我 们 知道 ， 字 典 能 存储 键 / 值 对 信息 ， 当 
遇 到 需要 通过 一 个 值 取得 另 一 个 值 时 , 字典 就 是 一 个 很 好 的 选择 。 特 别 在 项 目 中 , 需要 根据 唯一 标 
识 ( 如 id) 取得 统计 值 的 情况 很 多 ， 因 此 需要 字典 结构 的 支持 。 


(2) 在 哪些 领域 使 用 字典 比较 多 ? 

答 : 基本 需要 使 用 软件 的 领域 都 会 使 用 字典 结构 ， 毕 竟 这 是 一 个 基本 数据 结构 。 

(3) 其 他 语言 中 有 字典 的 说 法 吗 ? 

答 : 有 。 字 典 这 种 数据 结构 在 任何 编程 语言 中 都 有 ， 不 过 在 不 同 语言 中 定义 的 方式 不 太一 样 
如 在 Java 中 用 map 表示 字典 。 


5.7 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲解 了 字典 ， 在 本 章 结 束 前 回顾 一 下 学 到 的 概念 。 


(1) 字典 如 何 使 用 ? 
(2) 如 何 创建 字典 ， 字 典 有 哪些 基本 操作 ? 
(3) 字典 常用 的 方法 有 哪些 ， 该 怎么 使 用 ? 


思考 并 解决 如 下 问题 : 


(1) 创建 一 个 字典 ， 并 打印 出 字典 内 容 。 

(2) 自 定义 一 个 字典 ， 对 字典 中 某 个 值 进行 修改 。 

(3) 自 定义 一 个 字典 ， 删 除 字典 中 某 个 元 素 ， 并 修改 另外 某 个 元 素 。 

(4) 定义 一 个 字典 ， 打 印 出 字典 的 长 度 ， 清 空 字典 ， 再 打印 字典 的 长 度 。 

(5) 定义 一 个 字典 ， 对 字典 进行 浅 拷贝 和 深 拷贝 ， 并 比 对 两 者 的 异同 。 

(6) 定义 一 个 字典 ， 打 印 其 中 的 某 个 元 素 。 

(7) 定义 一 个 字典 ， 对 字典 进行 遍历 ， 打 印 对 应 的 key、value 值 。 

(8) 定义 一 个 字典 ， 将 字典 转化 为 列表 。 

(9) 用 dict 函数 实现 存储 一 个 人 的 姓名 、 手 机 号 和 地 址 信息 ， 字 符 串 名 称 和 值 由 自己 定义 和 
赋值 。 

(10) 创建 一 个 字典 ， 里 面 元 素 的 键 / 值 全 部 为 字符 串 ， 然 后 更 改 某 个 元 素 ， 更 改 其 值 为 非 字 
符 串 形式 ， 如 整数 、 浮 点 数 或 元 组 。 

(11) 定义 一 个 字典 ， 对 字典 按 key 进行 排序 ， 再 对 字典 按 value 进行 排序 。 
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条 件 、 循 环 和 其 他 语 名 


学 习 了 Python 的 一 些 基 本 概念 
本 章 将 会 从 import 语句 开始 
次 的 语句 。 


数据 结构 ， 相 信 你 已 经 有 一 定 基础 了 。 
深入 介绍 条 件 语句 、 循 环 语句 以 及 列表 推导 式 等 一 些 更 深层 





6.1 使 用 文本 编辑 堪 


到 目前 为 止 ， 我 们 都 是 在 Python 的 交互 式 命令 行 下 操作 的 ， 优 点 是 能 很 快 得 到 操作 结果 ， 不 
过 缺点 也 很 明显 ， 就 是 没 法 保存 操作 记录 。 如 果 下 次 还 想 运行 已 经 编写 过 的 程序 ， 就 得 重新 编写 一 
遍 。 更 重要 的 一 点 是 ， 稍 微 复杂 的 程序 使 用 交互 命令 行 操作 起 来 就 会 很 复杂 。 在 实际 开发 时 ， 可 以 
使 用 文本 编辑 器 编写 复杂 的 代码 ， 写 完 后 可 以 保存 为 一 个 文件 ， 程 序 也 可 以 反复 运行 。 

这 里 推荐 两 款 文本 编辑 器 : 一 款 是 Sublime Text， 可 以 免费 使 用 ， 但 是 不 付费 会 弹出 提示 框 ， 
使 用 界面 如 图 6-1 所 示 ; 另 一 款 是 Notepad++， 也 可 以 免费 使 用 ， 可 根据 自己 的 需要 选择 中 文 版 和 
英文 版 ， 使 用 界面 如 图 6-2 所 示 。 


国 Di\python\workspace\hello.py . - Sublime Text 2 (UNREGISTERED OT M000 es ES 









File Edit Selection Find View Goto Tools Project Preferences Help 





图 6-1 Sublime Text 编 辑 器 





TF DA\python\workspace\hello.py - Notepad++ 





文件 昌 ”编辑 (E) 搜索 (S) 视图 VW) 格式 (M) 语言 () 设置 四 宏 (Q) 运行 R) 插件 P)， 瘟 D 2 
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图 6-2 Notepad++ 编 辑 器 
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以 上 两 个 编辑 器 使 用 哪 一 个 都 可 以 , 笔者 使 用 的 是 Notepad++ 编 辑 器 ， 后 面 的 示例 若 没有 特殊 
说 明 ， 指 的 就 是 在 Notepad++ 编 辑 器 下 操作 。 


绝对 不 能 使 用 Word 和 Windows 自 带 的 记事 本 。Word 保存 的 不 是 纯 文本 文件 ， 而 记事 本 会 


自动 在 文件 开始 的 地 方 加 上 几 个 特殊 字符 (UTF-8 BOM ), 从 而 导致 程序 运行 时 出 现 莫名 其 
妙 的 错误 。 





安装 好 文本 编辑 器 后 ， 打 开 编辑 器 ， 输 入 以 下 代码 : 


Print('"Hellovworld!') 
提 ” 示 
print 前 面 不 要 有 任何 空格 。 


输入 完成 后 ， 将 文本 保存 到 指定 目录 (如 Di\python\workspace) ， 保 存 文件 名 为 hello.py ( 文 
件 的 命名 随 自己 的 喜好 ， 但 一 定 要 以 .py 结尾 ) 。 文 件 名 只 能 是 英文 字母 、 数 字 和 下 画 线 的 组 合 。 
建议 文件 名 有 一 定 意义 ， 方 便 记 忆 和 日 后 查看 。 

打开 命令 行 窗口 〈 如 在 Windows 中 打开 cmd 命令 窗口 ) ， 把 当前 目录 切换 到 hello.py 所 在 的 
目录 ， 如 图 6-3 所 示 。 


丽 C\Windows\system32\cmdexe 一 LEE 
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22:21 《<DIR> 
22:21 -<DIR> 


Dp: \python workspace 





图 6-3 切换 到 hello.py 所 在 的 目录 
切换 到 workspace 目录 下 ， 输 入 dir 命令 ， 查 看 该 文件 夹 中 有 哪些 文件 。 当 前 窗口 中 该 文件 夹 


下 有 一 个 名 为 hello.py 的 文件 。 接 下 来 在 cmd 命令 窗口 输入 python hello.py 命令 运行 hello.py， 如 
图 6-4 所 示 。 





图 64 输入 命令 执行 hello.py 文件 
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在 cmd 命令 窗口 中 执行 Python 文件 的 命令 格式 为 : 

Python 带 py 后 组 的 文件 名 ， 如 hello.PY 

输入 命令 后 按 Enter 键 ， 即 可 在 cmd 命令 窗口 输出 结果 ， 如 示例 中 的 “Hello;world!”。 

如 果 输 入 执行 的 文件 不 存在 就 会 报错 ， 如 在 上 面 的 示例 中 输入 python hi.py，cmd 命令 窗口 就 
会 输出 如 下 错误 : 


D:\python\workspace>python hi.py 
Python: can't open file 'hi.py': [Errno 2] No such file or directory 


该 错误 信息 的 意思 是 ， 无 法 打开 hi.py 文件 ， 没 有 这 个 文件 或 目录 。 如 果 在 操作 中 看 到 类 似 错 
误 ， 就 需要 查看 当前 目录 下 是 否 有 这 个 文件 ， 如 用 dir 命令 查看 当前 文件 夹 下 是 否 有 对 应 文件 。 如 
果 文 件 存放 在 另 一 个 目录 下 ， 就 要 用 cd 命令 切换 到 对 应 目录 。 


6.2 import 的 使 用 


语言 的 学 习 只 有 在 不 断 深入 后 才能 进一步 发 现 其 中 隐藏 的 惊人 特性 , 即使 是 简单 的 print 函数 ， 
在 不 断 使 用 后 也 会 发 现 更 多 使 用 方式 ，import 将 带 你 进入 一 个 更 快捷 的 编程 模式 。 


6.2.1 import 语句 


在 讲解 import 语句 之 前 先 看 一 个 示例 : 
import math 


r=5 


print (' 半 径 为 5 的 圆 的 面积 为 : %$.2f' %(math.pi*r**2)) 
保存 文件 名 为 import_test.py。 在 cmd 命令 窗口 执行 如 下 命令 : 


D:\python\workspace>python import test.py 

半径 为 5 的 圆 的 面积 为 : 78. 54 

上 面 的 程序 使 用 了 import 语句 。 

import math 的 意思 为 从 Python 标准 库 中 引入 math.py 模块 , 这 是 Python 中 定义 的 引入 模块 的 
方法 。import 的 标准 语法 如 下 : 

import modulel[, module2[,... moduleN]] 

表示 人 允许 一 个 import 导入 多 个 模块 ， 但 各 个 模块 间 需 要 用 逗号 隅 开 。 

当 解 释 器 遇 到 import 语句 时 ， 如 果 模 块 在 当前 搜索 路 径 就 会 被 导入 。 搜 索 路 径 是 一 个 解释 器 ， 
会 先 搜索 所 有 目录 的 列表 。 

当 我 们 使 用 import 语句 时 ,Python 解释 器 怎样 找到 对 应 的 文件 呢 ? 这 涉及 Python 的 搜索 路 径 ， 
搜索 路 径 由 一 系列 目录 名 组 成 ，Python 解释 器 会 依次 从 这 些 目录 中 寻找 引入 的 模块 。 看 起 来 很 像 
环境 变量 ， 事 实 上 可 以 通过 定义 环境 变量 的 方式 确定 搜索 路 径 。 搜 索 路 径 是 在 Python 编译 或 安装 
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时 确定 的 ， 被 存储 在 sys 模块 的 path 变量 中 。 查 看 搜索 路 径 的 方式 如 下 : 


import sys 
print ('Python 的 搜索 路 径 为 : ss' % sys.path) 


保存 文件 名 为 import_sys.py， 在 cmd 命令 窗口 执行 结果 如 下 : 

D:\python\workspace>python import sys.py 

Python 的 搜索 路 径 为 : ['D: \\python\\workspace','E:\\python\\ python37\\python 

37.zip', 'E:\\python\\ python37\\DLLs', 'E:\\python\\ python37\\1ib', 'E:\\python\\ python37', 
'E:\\python\\python37\\lib\\site-packages'] 

由 以 上 输出 结果 看 到 ，sys.path 输出 了 一 个 列表 ， 第 一 项 输出 的 是 执行 文件 所 在 的 目录 ， 即 我 
们 执行 Python 解释 器 的 目录 《〈 如 果 是 脚本 ， 就 是 运行 脚本 所 在 的 目录 ) 。 

了 解 搜索 路 径 的 概念 后 ， 可 以 在 脚本 中 修改 sys.path 引入 一 些 不 在 搜索 路 径 中 的 模块 。 

上 面 我 们 初步 引入 了 import 语句 ， 除 了 用 import 引入 模块 外 ， 还 有 另 一 种 方式 引入 模块 ， 先 
看 交互 模式 下 输入 的 示例 : 


>>> from math import Pi 
>>> Print (Pi) 
3.141592653589793 


上 面 的 操作 使 用 了 from math import pi 的 方式 ， 这 是 什么 意思 呢 ? 
在 Python 中 ，from 语句 可 以 从 模块 中 导入 指定 部 分 到 当前 命名 空间 中 ， 语 法 如 下 : 


from modname import namel[, name2[, ... nameN]] 


例如 ,from math import pi 语句 就 是 从 math 模块 中 导入 pi 到 当前 命名 空间 ,该 语句 不 会 将 math 
整个 模块 导入 。 比 如 在 math 模块 中 还 有 sin、exp 函数 ， 在 这 个 语句 里 这 两 个 函数 都 使 用 不 了 ， 而 
在 导入 整个 math 模块 的 语句 中 可 以 使 用 。 在 交互 模式 下 输入 : 


>>> import math 


>>> print (math.pi) #math .pi 可 以 被 输出 
3.141592653589793 

>>> print (math.sin (1)) #math. sin (1) 可 以 被 输出 
0.8414709848078965 


>>> print (math.exp (1)) #math.exp (1) 可 以 被 输出 
2.718281828459045 
>>> from math import Pi 


>>> print (pi) #Pi 可 以 被 输出 
3.141592653589793 
>>> print(sin (1)) #sin (1) 不 可 以 被 输出 


Traceback (most recent call last) : 
File "<stdin>", line 1, in <module> 
NameError: name 'sin' is not defined 
>>> print (exp (1)) #exp (1) 不 可 以 被 输出 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
NameError: name 'exp' is not defined 


由 以 上 输出 结果 可 知 ， 如 果 导 入 模块 ， 就 会 得 到 模块 中 所 有 对 象 ， 如果 指定 导入 某 个 对 象 ， 
就 只 能 得 到 该 对 象 。 
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这 样 做 的 好 处 是 什么 呢 ? 先 看 如 下 示例 : 

>>> import math 

>>> print (math .pi) 

3.141592653589793 

>>> print (pi) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

NameError: name 'pi' is not defined 

>>> from math import pi 

>>> print (pi) 

3.141592653589793 

由 上 面 的 输出 结果 可 知 ， 如 果 在 导入 math 模块 时 访问 pi 对 象 ， 需 要 使 用 math.pi， 直 接 使 用 
pi 访问 不 了 ， 会 报错 。 使 用 import 语句 后 ， 可 以 直接 访问 pi 对 象 ， 不 需要 加 上 模块 名 进行 访问 。 

如 果 要 访问 模块 中 多 个 对 象 ， 是 否 需 要 一 个 一 个 导入 呢 ? 如 果 要 访问 math 中 的 pi 和 sin， 是 
和 否 要 写 两 个 fom math import 语句 ? 例如 : 

from math import Pi 

from math import sin 


当然 不 用 ， 可 以 直接 使 用 如 下 语句 : 

from math import pi,sin 

可 以 从 一 个 导入 语句 导入 多 个 函数 ， 多 个 函数 之 间 用 逗号 分 割 。 

如 果 要 访问 模块 中 多 个 对 象 ， 是 否 需 要 一 个 一 个 导入 呢 ? 当 然 不 用 ， 可 以 直接 使 用 如 下 语句 : 

from math import * 

使 用 该 语句 可 以 将 math 中 所 有 对 象 都 引入 , 比如 上 面 几 种 报错 的 情况 就 可 以 成 功 输出 结果 了 ， 
例如 : 


>>> from math import * 


>>> print (pi) #pi 可 以 被 输出 
3.141592653589793 

>>> print(sin(1)) #sin (1) 可 以 被 输出 
0.8414709848078965 

>>> print (exp (1)) #exp (1) 可 以 被 输出 


2.718281828459045 


由 输出 结果 看 到 ，pi、sin、exp 等 函数 都 可 以 被 正确 输出 了 。 这 是 一 个 简单 地 将 项 目 中 所 有 模 
块 都 导入 的 方法 。 在 实际 开发 中 ， 这 种 声明 不 建议 过 多 使 用 ， 这 样 不 利于 编写 清晰 、 简 单 的 代码 。 
只 有 想 从 给 定 模块 导入 所 有 功能 时 才 使 用 这 种 方式 。 

除了 上 述 几 种 方式 外 ， 还 可 以 为 模块 取 别 名 ， 例 如 : 


>>> import math as m 
>>> m.pi 
3.141592653589793 


由 输出 结果 看 到 ， 给 模块 取 别 名 的 方式 为 : 在 导出 模块 的 语句 末尾 增加 一 个 as 子 句 ，as 后 面 
跟 上 别名 名 称 。 
既然 可 以 为 模块 取 别 名 ， 当 然 也 可 以 为 函数 取 别 名 ， 例 如 : 
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>>> from math import pi as p 
>>>p 
3.141592653589793 


由 输出 结果 可 知 ， 我 们 为 pi 取 了 别名 为 p， 为 函数 取 别 名 的 方式 和 为 模块 取 别 名 的 方式 类 似 ， 
也 是 在 语句 后 面 加 上 as，as 后 跟 上 别名 名 称 。 


6.2.2 ”使 用 逗号 输出 


我 们 在 前 面 的 章节 已 经 看 到 许多 使 用 逗号 输出 的 示例 ， 例 如 : 

>>> student=' 小 智 ' 

>>> print(' 学 生 称呼 : ', student) 

学 生 称呼 。 小 智 

这 种 方式 还 可 以 输出 多 个 表达 式 ， 只 要 将 多 个 表达 式 用 逗号 隔 开 就 行 ， 例 如 : 


>>> greeting=' 大 家 好 ! ， 

>>> intriduce=' 我 叫 小 智 ，" 

>>> comefrom=' 我 来 自 智慧 城市 。' 

>>> Print(greeting intriduce,comefrom) 


大 家 好 ! 我 叫 小 智 ， 我 来 自 智 慧 城市 。 
由 输出 结果 看 到 ， 不 使 用 格式 化 的 方式 也 可 以 同时 输出 文本 和 变量 值 。 


6.3 别 样 的 赋值 


之 前 我 们 介绍 了 很 多 赋值 语句 ， 在 实际 使 用 中 ， 赋 值 语句 还 有 很 多 特殊 用 法 ， 人 掌握 这 些 用 法 
对 于 提高 编程 水 平 很 有 帮助 。 


6.3.1 序列 解 包 


前 面 已 经 有 不 少 赋值 语句 的 示例 ， 比 如 变量 和 数据 结构 成 员 的 赋值 ， 不 过 赋值 的 方法 不 止 这 
， 例 如 : 


>>> x,y,2z=1,2,3 
>>> print (x,y,2z) 
人 


由 输出 结果 看 到 ， 可 以 多 个 赋值 操作 同时 进行 。 后 面 再 遇 到 对 多 个 变量 赋值 时 ， 就 不 需要 对 
一 个 变量 赋 完 值 再 对 另 一 个 变量 赋值 了 ， 用 一 条 语句 就 可 以 搞定 ， 例 如 : 


>>> x,yr2=1,2,3 
>>> xyvy=yrx 


恬 


>>> print (x,y, 2) 
eM 


由 输出 结果 看 到 ，x 和 y 的 值 交换 了 ， 所 以 可 以 交换 两 个 或 多 个 变量 的 值 。 
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在 Python 中， 交换 所 做 的 事情 叫 作 序列 解 包 (sequence unpacking) 或 可 选 迁 代 解 包 ， 即 将 多 
个 值 的 序列 解 开 ， 然 后 放 到 变量 序列 中 。 可 以 通过 下 面 的 示例 理解 : 


>>> nums=1,2,3 


>>> nums 
(fo Pe ] 
>>> xy z=nums 
2 # 获 得 序列 解 开 的 值 
1 
>>> print (x,y,2) 
E23 
由 输出 结果 看 到 ， 序 列 解 包 后 ， 变 量 获得 了 对 应 的 值 。 
再 看 另 一 个 示例 : 


>>> student={'name' :' 小 戎 ', 'number':'1001'} 
>>> key,value=student .popitem() 

>>> key 

'number' 

>>> value 

"1001" 


由 输出 结果 可 知 ， 此 处 作用 于 元 组 ， 使 用 popitem 方法 将 键 - 值 作为 元 组 返回 ， 返 回 的 元 组 可 
以 直接 赋值 到 两 个 变量 中 。 

序列 解 包 允许 函数 返回 一 个 以 上 的 值 并 打包 成 元 组 ， 然 后 通过 一 个 赋值 语句 进行 访问 。 这 里 
要 注意 , 解 包 序列 中 的 元 素数 量 必须 和 放置 在 赋值 符号 “= "左边 的 数量 完全 一 致 , 否则 Python 
时 引发 异常 ， 例 如 : 


>>> XryrzZ=1,2,3 








>>> xvyvzZ 
(1, 2, 3) 
>>> x,y,2=1,2 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ValueError: not enough values to unpack (expected 3, got 2) 
>>> xyyr2=1,2,3,4,5 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ValueError: too many values to unpack (expected 3) 


由 以 上 输出 结果 看 到 ， 当 右边 的 元 素数 量 和 左边 的 变量 数量 不 一 致 时 ， 执 行 结果 就 会 报错 。 
错误 原因 是 没有 足够 的 值 解 包 (左边 变量 多 于 右边 元 素 ) 或 多 个 值 未 解 包 (左边 变量 少 于 右边 元 素 )。 





在 操作 序列 解 包 时 ， 要 保证 左边 和 右边 的 数量 相 


6.3.2” 链 式 赋值 


6.3.1 小 节 介绍 了 可 以 对 序列 解 包 ， 序 列 解 包 在 对 不 同 变量 赋 不 同 的 值 时 非常 有 用 ， 赋 相同 的 
值 时 用 序列 解 包 也 可 以 实现 。 其 实 还 可 以 使 用 其 他 方法 ， 如 链 式 赋值 (Chained Assignment) ， 示 
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由 输出 结果 可 知 ， 可 以 通过 多 个 等 式 为 多 个 变量 赋 同 一 个 值 ， 这 种 方法 叫 作 链 式 赋值 。 
链 式 赋值 是 将 同一 个 值 赋 给 多 个 变量 。 
上 面 的 语句 效果 和 下 面 的 语句 效果 一 样 : 


由 输出 结果 可 知 ， 既 可 以 使 用 链 式 方式 赋值 ， 又 可 以 单独 赋值 ， 显 然 链 式 方法 更 简洁 。 


6.3.3” 增 量 赋值 


我 们 在 第 2 章 讲 解 了 赋值 运算 符 。 使 用 赋值 运算 符 时 没有 将 表达 式 写 成 类 似 x=x+1 的 形式 ， 
而 是 将 表达 式 放 置 在 赋值 运算 符 (=) 的 左边 (如 将 x=x+1 写成 xt=1) ， 这 种 写法 在 Python 中 叫 
作 增 量 赋值 (Augemented Assignment) 。 这 种 写法 对 * ( 乘 ) 、/( 除 ) 、%〔 取 模 ) 等 标准 运算 符 
都 适用 ， 例 如 : 





由 操作 结果 可 以 看 到 ， 使 用 增 量 赋值 相对 于 赋值 操作 看 上 去 更 简洁 。 
增 量 赋值 除了 适用 于 数值 类 型 外 ， 还 适用 于 二 元 运算 符 的 数据 类 型 ， 例 如 : 





由 操作 结果 可 知 ， 增 量 赋值 操作 也 可 以 用 于 字符 串 。 
增 量 赋值 可 以 让 代码 在 很 多 情况 下 更 易 读 ， 也 可 以 帮助 我 们 写 出 更 紧凑 、 简 练 的 代码 。 
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6.4 语 句 块 


语句 块 并 非 一 种 语句 ， 语 句 块 是 一 组 满足 一 定 条 件 时 执行 一 次 或 多 次 的 语句 。 语 句 块 的 创建 
方式 是 在 代码 前 放置 空格 缩 进 。 

同一 段 语 句 块 中 每 行 语句 都 要 保持 同样 的 缩 进 ， 如 果 缩 进 不 同 ，Python 编译 器 就 会 认为 不 属 
于 同一 个 语句 块 或 认为 是 错误 的 。 

在 Python 中 ,冒号 (:) 用 来 标识 语句 块 的 开始 ， 语 句 块 中 每 一 个 语句 都 需要 缩 进 〈 缩 进 量 相 
同 ) 。 当 退回 到 和 已 经 闭合 的 块 一 样 的 缩 进 量 时 ， 表 示 当 前 语句 块 已 经 结束 了 。 





6.5 条 件 语句 


到 目前 为 止 ， 我 们 编写 的 程序 都 是 简单 地 按 语 句 顺序 一 条 一 条 执行 的 。 本 节 将 介绍 让 程序 选 
择 执行 语句 的 方法 。 


6.5.1 布尔 变量 的 作用 


布尔 变量 我 们 在 第 2 章 已 经 有 所 接触 ， 第 2 章 的 运算 符 中 多 处 提 到 的 True、False 就 是 布尔 变 
量 ， 布 尔 变量 一 般 对 应 的 是 布尔 值 ( 也 称 作 真 值 ， 布 尔 值 这 个 名 字 是 根据 对 真 值 做 过 大 量 研 究 的 
George Boole 命名 的 ) 。 

下 面 的 值 在 作为 布尔 表达 式 时 ， 会 被 解释 器 看 作假 (False) : 


False None 0 "" () [] {} 


换 句 话 说， 标准 值 False 和 None、 所 有 类 型 的 数字 0 (包括 浮 点 型 、 长 整 型 和 其 他 类 型 》、 空 序列 
〈 如 空 字 符 串 、 空 元 组 和 空 列 表 ) 以 及 空 字典 都 为 假 。 其 他 值 都 为 真 ， 包 括 原生 的 布尔 值 True。 

Python 中 所 有 值 都 能 被 解释 为 真 值 , 这 可 能 会 让 你 不 太 明 白 , 但 理解 这 点 非常 有 用 。 在 Python 
中 ， 标 准 的 真 值 有 True 和 False 两 个 。 在 其 他 语言 中 ， 标 准 的 真 值 为 0 (表示 假 ) 和 1 (表示 真 ) 。 
事实 上 ，True 和 False 只 不 过 是 1 和 0 的 另 一 种 表现 形式 ， 作 用 相同 ， 例 如 : 


>>> True 

True 

>>> False 

False 

>>> True == 1 
True 

>>> False == 0 
True 

>>> TruetFalse+2 
3 
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由 上 面 的 输出 结果 看 到 ， 在 Python 中 ，True 和 1 等 价 ，False 和 0 等 价 。 
布尔 值 True 和 False 属于 布尔 类 型 ，bool 函数 可 以 用 来 转换 其 他 值 ， 例 如 : 


>>> bool('good good study') 
True 

>>> boo1('') 
False 

>>> bool (3) 
True 

>>> bool(0) 
False 

>>> bool([1]) 
True 

>>> bool([]) 
False 

>>> bool () 
False 


由 输出 结果 看 到 ， 可 以 用 bool 函数 做 boolean 值 转换 。 
因为 所 有 值 都 可 以 用 作 布 尔 值 〈 真 值 ) ， 所 以 几乎 不 需要 对 它们 进行 显 式 转换 ，Python 会 自 
动 转换 这 些 值 。 


尽管 ] 和 "" 都 为 假 ， 即 bool([]) 一 bool("") 一 False， 不 过 它们 本 身 不 相等 ， 即 []!=""。 其 他 不 同 
类 型 的 假 值 也 是 如 此 ， 如 (0!=False。 





6.5.2 if 语句 


真 值 可 以 联合 使 用 ， 首 先 看 如 下 代码 : 


#! /usr/bin/python3 
# -*- coding:UTF-8 -*— 
# if 基本 用 法 


greeting='hello" 
if greeting == 'hello': 
print ('hello') 


该 示例 执行 结果 如 下 : 

hello 

该 示例 为 让 条 件 执 行 语句 的 一 个 实现 示例 。 如果 条 件 (在 这 和 冒号 之 间 的 表达 式 ) 判定 为 真 ， 
后 面 的 语句 块 〈 本 例 中 是 print 语句 ) 就 会 被 执行 ， 如 果 条 件 判 定 为 假 ， 语 句 块 就 不 会 被 执行 。 

上 述 示例 代码 的 执行 过 程 如 图 6-5 所 示 。 

图 6-5 中 的 小 黑 点 为 让 语句 的 起 点 ， 往 后 执行 到 条 件 语 句 条件 语 句 如 greeting == 'hello') ， 
如 果 条 件 为 真 ， 就 执行 条 件 代码 ， 然 后 结束 这 个 if 条 件 语 句 ; 如 果 条 件 为 假 ， 就 跳 过 这 段 条 件 代 
人 码 ， 这 个 让 条 件 语句 直接 结束 。 
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如 果 条 件 为 false 








6-5 让 条 件 语句 执行 过 程 
在 让 语句 块 中 还 可 以 执行 一 些 复杂 操作 ， 例 如 (文件 名 为 if_use.py》: 


#! /usr/bin/python3 
# =-*- coding:UTF-8 -*= 


# if 基本 用 法 
greeting='hello' 
if greeting == 'hello': 
student={ ' 小 萌 ': '1001'，' 小 智 ': '1002' ，' 小 强 ' : '1005', ' 小 张 ': '1006'} 
print (f' 字 典 元 素 个 数 为 ，{ len (student)}') 
student .clear () 
Print (f' 字 典 删 除 后 元 素 个 数 为 :，{ len (student)}') 


以 上 程序 执行 结果 为 : 


字典 元 素 个 数 为 ，4 个 
字典 删除 后 元 素 个 数 为 ，0 个 


此 处 的 让 语句 块 由 多 条 语句 组 成 ， 编 写 过 程 中 要 注意 保持 语句 的 缩 进 一 致 ， 否 则 在 执行 时 会 报错 。 
论语 句 的 条 件 判 定 除 了 使 用 一 外 ， 还 可 以 使 用 > (大 于 ) 、<( 小 于 )、>= (大 于 等 于 ) 、<= (小 
于 等 于 ) 等 条 件 符 表示 大 小 关系 。 除 此 之 外 ， 还 可 以 使 用 各 个 函数 或 方法 返回 值 作为 条 件 判 定 。 使 





用 条 件 符 的 操作 和 使 用 == 一 样 ， 使 用 函数 或 表达 式 的 操作 在 后 续 章 节 会 逐步 介绍 。 


在 练习 过 程 中 ， 要 习惯 编写 示例 中 开头 两 行 的 写法 ， 即 习惯 写 以 下 两 行 代码 : 
#! /usr/bin/python3 
# -*- coding:UTF-8 -*— 


习惯 写 这 两 行 代码 可 以 帮助 你 在 代码 移植 和 编码 问题 上 避免 很 多 问题 。 代 码 移植 时 ， 如 果 
从 Windows 移植 到 Linux 系统 上 ， 就 必须 加 上 第 一 行 代码 。 代 码 中 有 中 文 时 ， 如 果 不 加 第 
二 行 代码 ， 就 很 容易 出 现 乱码 的 情况 。 
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6.5.3 else 子 句 


在 让 语句 的 示例 中 ， 当 greeting 的 值 为 hello 时 ， 让 后 面 的 条 件 执行 结果 为 tue， 进 入 下 面 的 
语句 块 中 执行 相关 语句 。 如 果 greeting 的 值 不 是 hello， 就 不 能 进入 语句 块 ， 如 果 想 显示 相关 提示 ， 
比如 告诉 我 们 greeting 的 值 不 为 hello 或 执行 的 不 是 府中 的 语句 块 ， 该 怎么 办 呢 ? 例如 (文件 命名 
if else use.py) : 

#! /usr/bin/python3 


# -*- coding:UTF-8 一 * 一 


greeting='hi'" 

if greeting == 'hello': 
print('hello') 

else: 


print (' 该 语句 块 不 在 if 中 ，greeting 的 值 不 是 hello') 
这 段 程序 加 入 了 一 个 新 条 件 子 句 一 一 else 子 句 。 之 所 以 叫 子 句 ,是 因为 else 不 是 独立 语句 ,只 
能 作为 ff 语句 的 一 部 分 。 使 用 else 子 句 可 以 增加 一 种 选择 。 
该 程序 的 输出 结果 如 下 : 
该 语句 块 不 在 if 中 ，greeting 的 值 不 是 hello 
由 输出 结果 看 到 ， 证 语句 块 没 有 被 执行 ， 执 行 的 是 else 子 句 中 的 语句 块 。 同 让 语句 一 样 ，else 
子 句 中 的 语句 块 也 可 以 编写 复杂 语句 。 


提 ” 示 


在 else 子 句 后 面 没有 条 件 判 定 。 


6.5.4 elf 子 名 


在 else 子 句 的 示例 中 ， 如 果 除 让 条 件 外 ， 还 有 多 个 子 条 件 需 要 判定 ， 该 怎么 办 呢 ? 
Python 为 我 们 提供 了 一 个 elif 语 句 ，elif 是 else 认 的 简写 ， 意 思 为 具有 条 件 的 else 子 句 ， 例 如 
(文件 命名 if elif use.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 -*— 


num = 10 
if num > 10: 

print ('num 的 值 大 于 10') 
elif 0<=num<=10: 

print ("num 的 值 介 于 0 和 10 之 间 ') 
else: 

print ('num 的 值 小 于 0') 


由 以 上 程序 可 知 ，elif 需要 和 if、else 子 句 联合 使 用 ,不 能 独立 使 用 ， 并且 必须 以 让 语句 开头 ， 
可 以 选择 是 否 以 else 子 句 结尾 。 
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程序 输出 结果 如 下 : 
num 的 值 介 于 0 和 10 之 间 


由 输出 结果 得 知 , 这 段 程序 执行 的 是 elif 子 句 中 的 语句 块 , 即 elift 子 句 的 条 件 判 定 结果 为 true， 
所 以 执行 这 个 子 句 后 的 语句 块 。 


6.5.5” 矢 套 代码 块 


我 们 前 面 讲述 了 让 语句 、else 子 句 和 elif 子 句 ， 这 几 个 语句 可 以 进行 条 件 的 选择 判定 ， 不 过 我 
们 在 实际 项 目 开 发 中 经 常 需要 一 些 更 复杂 的 操作 ， 例 如 (文件 命名 if nesting_use.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 -*— 


num = 10 
if num%2==0: 
if num%3==0: 
Print ("你 输入 的 数字 可 以 整除 2 和 3") 
elif num%4==0: 
print ("你 输入 的 数字 可 以 整除 2 和 4") 
else: 
Print ("你 输入 的 数字 可 以 整除 2， 但 不 能 整除 3 和 4") 
else: 
if num%3==0: 
Print ("你 输入 的 数字 可 以 整除 3， 但 不 能 整除 2") 
else: 


print ("你 输入 的 数字 不 能 整除 2 和 3") 

由 上 面 的 程序 可 知 ， 在 让 语句 的 语句 块 中 还 存在 让 语句 、 语 句 块 以 及 else 子 句 ，else 子 句 的 
语句 块 中 也 存在 让 语句 和 else 子 句 。 

上 面 的 程序 输出 结果 如 下 : 

你 输入 的 数字 可 以 整除 2， 但 不 能 整除 3 和 4 

由 输出 结果 可 以 看 出 ， 执 行 的 是 论语 句 块 中 else 子 句 的 语句 块 。 

在 Python 中 ， 该 示例 使 用 的 这 种 结构 的 代码 称 作 嵌 套 代码 。 所 谓 嵌 套 代 码 ， 是 指 把 if、else、 
elif 等 条 件 语 句 再 放 入 if、else、elif 条 件 语 句 块 中 ， 作 为 深层 次 的 条 件 判 定语 句 。 


6.5.6 ”更 多 操作 


我 们 在 第 2 章 简 单 介 绍 过 一 些 运算 符 ， 本 节 将 对 其 中 一 些 涉及 条 件 运算 的 运算 符 做 进一步 讲解 。 
1.is: 同一 性 运算 符 
is 运算 符 比较 有 趣 。 我 们 先 看 如 下 程序 : 


>>> x=y=[1,2,3] 
>>> z=[1,2,3] 
>>> x==y 

True 
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问题 ， 


>>> x=z 
True 
> x A 
True 
>>> x is z 
False 


在 最 后 一 个 输出 语句 之 前 ， 一 切 看 起 来 非常 美好 ， 都 在 意料 中 ， 不 过 最 后 一 个 语句 却 出 现 了 
为 什么 x 和 z 相等 却 不 相同 呢 ? 
这 是 因为 is 运算 符 用 于 判定 同一 性 而 不 是 相等 性 。 变 量 x 和 y 被 绑 定 在 同一 个 列表 上 ， 而 变量 


z 被 绑 定 在 另 一 个 具有 相同 数值 和 顺序 的 列表 上 。 它 们 的 值 可 能 相等 ， 却 不 是 同一 个 对 象 。 


指向 


不 同 


一 对 


也 可 以 从 内 存 的 角度 思考 ， 即 它们 所 指向 的 内 存 空 间 不 一 样 ，x 和 y 指向 同一 块 内 存 空 间 ，z 
另 一 块 内 存 空 间 。 
是 不 是 看 起 来 有 些 不 可 理喻 ， 再 看 如 下 示例 : 


>>> x=[1,2,3] 
>>> y=[1,5] 
>>> x is not y 
True 

>>> del x[2] 
>>> x 

[1, 2] 

>>> y[1]=2 
>>>y 

[1, 2] 

>>> x==y 
True 

>>> x isy 
False 


在 上 面 的 程序 中 ， 列 表 x 和 y 一 开始 是 不 同 的 列表 ， 后 面 将 列表 值 更 改 为 相等 ， 但 还 是 两 个 
的 列表 ， 即 两 个 列表 值 相等 却 不 等 同 。 

综 上 所 述 ， 使 用 一 运算 符 判定 两 个 对 象 是 否 相等 ， 使 用 is 判定 两 个 对 象 是 否 等 同 〈 是 否 为 同 
象 ) 。 





尽量 避免 用 运算 符 比较 数值 和 字符 串 这 类 不 可 变 值 。 由 于 Python 内 部 操作 这 些 对 象 方式 
的 原因 ， 使 用 is 运算 符 的 结果 是 不 可 预测 的 ， 除 非 你 对 堆栈 有 一 定 熟 悉 程 度 ， 否 则 很 难 预 
测 运算 结果 。 





2. 比较 字符 串 和 序列 
字符 串 可 以 按照 字母 排列 顺序 进行 比较 ， 我 们 在 前 面 的 章节 已 经 介绍 过 。 这 里 介绍 其 他 序列 





的 比较 操作 。 


其 他 序列 比较 的 不 是 字符 而 是 元 素 的 其 他 类 型 ， 例 如 : 


>>> [1,2]<[2,1] 
True 
| 
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False 
>>> [1,2]==[1,2] 
True 


由 操作 结果 可 知 ， 也 可 以 对 列表 进行 比较 操作 。 


如 果 一 个 序列 中 包括 其 他 序列 元 素 ， 比 较 规则 也 适用 于 序列 元 素 ， 例 如 : 


>>> [2, [i172]]<[I27 T1311 
True 


由 操作 结果 看 到 ， 也 可 以 对 媒 套 列表 进行 比较 操作 。 
3. 布尔 运算 符 


前 面 我 们 已 经 讲述 过 不 少 布尔 运算 的 操作 。 不 过 有 时 要 检查 一 个 以 上 的 条 件 ， 如 果 按 照 前 面 


的 操作 方式 ， 就 会 多 走 一 些 弯路 ， 例 如 (文件 命名 boolean oper.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 -*— 


num= 10 
if num <= 10: 
if num>=5: 
print ('num 的 值 介 于 5 和 10 之 间 ') 
else: 
print ('num 的 值 不 介 于 5 和 10 之 间 ') 
else: 


print ('num 的 值 不 介 于 5 和 10 之 间 ') 


上 面 的 程序 在 写法 上 没什么 问题 ， 但 是 走 了 一 些 不 必要 的 弯路 ， 可 以 将 代码 编写 得 更 简洁 : 


if num <= 10 and num>=5: 

print ("num 的 值 介 于 5 和 10 之 间 ') 
else: 

print ('num 的 值 不 介 于 5 和 10 之 间 ') 


或 者 : 
if 5 <= num <= 10: 
print ('num 的 值 介 于 5 和 10 之 间 ') 


else: 


print ('num 的 值 不 介 于 5 和 10 之 间 ') 
上 面 的 程序 明显 更 加 简洁 、 易 读 。 
and 运算 符 用 于 连接 两 个 布尔 值 ， 并 在 两 者 都 为 真 时 返回 真 ， 否 则 返回 





or 和 not 两 个 运算 符 。 
布尔 运算 符 有 一 个 有 趣 的 特性 : 只 有 在 需要 求 值 时 才 求 值 。 举 例 来 说 ， 


假 。 与 and 同类 的 还 有 


表达 式 x and y 需要 两 


个 变量 都 为 真 时 才 为 真 ， 所 以 如 果 x 为 假 ， 表 达 式 就 立刻 返回 色 lse， 无 论 y 的 值 是 多 少 。 实 际 上 ， 
如 果 x 为 假 ,表达 式 就 会 返回 x 的 值 , 否则 返回 y 的 值 .这 种 行为 被 称 为 短路 逻辑 (short-circuit logic) 
或 惰性 求 值 (lazy evaluation) 。 布 尔 运算 符 通 常 被 称 为 逻辑 运算 符 ， 这 种 行为 同样 适用 于 or。 在 
表达 式 xory 中 ，x 为 真 时 直接 返回 x 的 值 ， 否 则 返回 y 的 值 。 注 意 ， 这 意味 着 在 布尔 运算 符 后 面 











的 代码 都 不 会 被 执行 。 
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6.5.7 ”断言 


在 Python 中， 有 一 个 和 这 语 句 工作 方式 非常 相近 的 关键 字 ， 其 工作 方式 类 似 如 下 伪 代 码 : 


if not condition: 
Crash Program 


在 Python 中 为 什么 需要 这 样 的 代码 呢 ? 

在 没完 善 一 个 程序 之 前 ， 我 们 不 知道 程序 会 在 哪里 出 错 ， 与 其 在 运行 时 骨 泪 ， 不 如 在 出 现 错 
误 条 件 时 就 崩溃 。 一 般 来 说 ， 可 以 要 求 一 些 条 件 必 须 为 真 。 在 Python 中 ，assert 关键 字 就 能 实现 这 
种 工作 方式 。 先 来 看 一 个 示例 : 


>>> x=3 
>>> assert x > 0, "x is not zero or negative" 
>>> assert x%2 == 0，"x is not an even number"”# 提 示 x 不 是 偶数 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AssertionError: x is not an even number 


由 上 面 的 输出 结果 看 到 ， 当 assert 后 面 的 条 件 为 真 时 ， 程 序 正常 运行 ， 当 assert 后 面 的 条 件 为 
假 时 ,输出 错误 信息 。 错 误 的 提示 信息 由 我 们 自己 定义 , 这 个 错误 提示 信息 可 以 称 为 异常 参数 。assert 
的 异常 参数 是 在 断言 表达 式 后 添加 的 字符 串 信息 ， 用 来 解释 断言 并 更 容易 知道 问题 出 在 哪里 。 

使 用 assert 断言 是 学 习 Python 的 好 习惯 ，Python assert 断言 语句 的 格式 及 用 法 很 简单 。 

使 用 assert 断言 时 ， 要 注意 以 下 几 点 : 


(1) assert 断言 用 来 声明 某 个 条 件 是 真 的 。 

(2) 如 果 你 非常 确信 使 用 的 列表 中 至 少 有 一 个 元 素 ， 想 要 检验 这 一 点 ， 并 在 它 非 真 时 引发 一 
个 错误 ， 那 么 assert 语句 是 应 用 在 这 种 情形 下 的 理想 语句 。 

(3) assert 语句 失败 时 ， 会 引发 一 个 AssertionError。 


6.6 循 环 


程序 在 一 般 情 况 下 是 按 顺序 执行 的 。 编 程 语言 提供 了 各 种 控制 结构 , 允许 更 复杂 的 执行 路 径 。 
循环 语句 允许 我 们 多 次 执行 一 个 语句 或 语句 组 。 图 6-6 所 示 为 大 多 数 编程 语言 中 循环 语句 的 执行 

我 们 已 经 知道 条 件 为 真 〈 或 假 ) 时 程序 如 何 执行 了 。 若 想 让 程序 重复 执行 ， 该 怎么 办 呢 ? 比 
如 输出 1 一 100 所 有 数字 ， 是 写 100 个 输出 语句 吗 ? 显然 你 不 想 这样 做 。 接 下 来 我 们 学 习 如 何 解 决 
这 个 问题 。 
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6-6 ”循环 语句 执行 流程 


6.6.1 ”while 循环 


我 们 先 看 如 何 使 用 简单 的 程序 输出 1 一 100 所 有 数字 ， 程 序 如 下 (文件 命名 while_use.py) : 
#! /usr/bin/python3 
# -*- coding:UTF-8 -*-— 


n=1 
while n<=100: 
print (f' 当前 数字 是 : {n}') 


n+=1 


由 输入 程序 看 到 ， 只 需 短 短 几 行 就 可 以 实现 这 个 功能 ， 我 们 看 输出 结果 由 于 全 部 输出 会 太 


长 ， 也 没有 必要 ， 因 此 此 处 显示 几 行 输出 结果 作为 展示 ) : 





当前 数字 是 : 1 
当前 数字 是 : 2 
当前 数字 是 : 3 
当前 数字 是 : 4 
当前 数字 是 : 5 


由 输出 结果 看 到 ， 按 顺序 输出 了 对 应 结果 。 
该 示例 中 使 用 了 while 关键 字 。 在 Python 编程 中 ，while 语句 用 于 循环 执行 程序 ， 以 处 理 需要 


外 复 处 理 的 任务 。 基 本 语法 形式 为 : 


while 判断 条 件 : 


执行 语句 可 以 是 单个 语句 或 语句 块 。 判 断 条 件 可 以 是 任何 表达 式 ， 所 有 非 零 、 非 空 (null) 的 


值 都 为 真 〈true) 。 当 判断 条 件 为 假 (false) 时 ， 循 环 结束 。 
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while 循环 的 执行 流程 如 图 6-7 所 示 。 








while expression : 
statement(s) 


condition 


lf condition 
is true 






conditional 
code 






If condition 
is false 


6-7 while 循环 的 执行 流程 


该 流程 图 的 意思 为 : 首先 对 while 条 件 判定 ， 当 条 件 为 true 时 ,执行 条 件 语句 块 ， 执 行 完 语句 
块 再 判定 while 条 件 ， 若 仍然 为 rue， 则 继续 执行 语句 块 ， 直 到 条 件 为 false 时 结束 循环 。 


6.6.2 for 循环 


我 们 在 6.6.1 小 节 讲 述 了 while 循环 ， 可 以 看 到 while 语句 非常 灵活 ， 例 如 〈exp_while.py) : 


#! /usr/bin/python3 
# -*- coding:;UTF-8 -*— 


n=0 
fields=['a','b','c'] 
while n<len (fields): 
print (f' 当前 字母 是 : {fields [n] }') 


nt=1 

该 代码 实现 的 功能 是 将 列表 中 的 元 素 分 别 输出 。 该 程序 的 实现 没有 什么 问题 ， 我 们 是 否 有 更 
好 的 方式 实现 这 个 功能 呢 ? 答案 是 有 ， 例 如 〈for use.py) : 

#! /usr/bin/python3 


# -*- coding:UTF-8 -*— 


fields=['a','b','c'] 
for ff in fields: 


print (f' 当前 字母 是 : {f}') 


可 以 看 到 ， 代 码 比 前 面 使 用 while 循环 时 更 简洁 ， 代 码 量 也 更 少 。 程 序 执行 的 输出 结果 如 下 : 


当前 字母 是 : a 
当前 字母 是 : Pb 
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当前 字母 是 : c 

该 示例 使 用 了 for 关键 字 。 在 Python 中 ，for 关键 字 叫 作 for 循环 ，for 循环 可 以 遍历 任何 序列 
的 项 目 ， 如 一 个 列表 或 字符 串 。 

for 循环 的 语法 格式 如 下 : 

for iterating_var in sequence: 

statements(s) 
sequence 是 任意 序列 ，iterating_var 是 序列 中 需要 遍历 的 元 素 ，statements 是 待 执行 的 语句 块 。 
for 循环 的 执行 流程 如 图 6-8 所 示 。 











for iterating_var in sequence : 
statement(s) 


fe Mf no more item in sequence 


sequence 


Next item from sequence 


execute statement(s) 


图 6-8 for 循环 的 执行 流程 


该 流程 图 的 意思 为 : 首先 对 for 条 件 判定 ， 游 标 〈 后 面 会 详细 讲解 这 个 词 ) 指向 第 0 个 位 置 ， 
即 指向 第 一 个 元 素 ， 看 sequence 序列 中 是 否 有 元 素 ， 若 有 ， 则 将 元 素 值 赋 给 iterating_var， 接 着 执 
行 语句 块 ， 若 语句 块 中 需要 获取 元 素 值 ， 则 使 用 iterating_var 的 值 ， 执 行 完 语 句 块 后 ， 将 序列 的 游 
标 往 后 挪 一 个 位 置 ， 再 判定 该 位 置 是 否 有 元 素 ， 若 仍然 有 元 素 ， 则 继续 执行 语句 块 ， 然 后 序列 的 游 
标 再 往 后 挪 一 个 位 置 ， 直 到 下 一 个 位 置 没有 元 素 时 结束 循环 。 

我 们 再 看 以 下 示例 (exp_forpy) : 

#! /usr/bin/python3 


# -*- coding:UTF-8 -*— 


Pont = for 循环 字符 串 ----------- ') 
for letter in 'good': ”#for 循环 字符 串 
print (f' 当 前 字母 :{letter}') 


Print ('-——--: for 循环 数字 序列 ----------- ') 

number=[1,2,3] 

for num in number: #for 循环 数字 序列 
Print (f' 当前 数字 : {num} ') 


Print ('—-——-— for 循环 字典 --- 一 ---- 一 内 
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tups={'name' : ' 小 智 ', 'number"' :'1002'} 
for tup in tups:  ”#for 循环 字典 
Print (f'{tup}:{tups [tup] }"') 


输出 结果 如 下 : 
当前 字母 : g 
当前 字母 : o 


当前 字母 : o 
当前 字母 : a 


当前 数字 :1 


number:1002 
name :小 智 


由 上 面 的 输入 代码 和 输出 结果 可 以 看 到 ，for 循环 的 使 用 还 是 比较 方便 的 。 


如 果 能 使 用 for 循环 ， 就 尽量 不 要 使 用 while 循环 。 





6.6.3 ”循环 遍历 字典 元 素 


在 6.6.2 小 节 的 示例 中 我 们 已 经 提供 了 使 用 for 循环 遍历 字典 的 代码 ， 代 码 如 下 〈for in.py) : 

tups={'name': ' 小 智 ', 'number' : '1002'} 

for tup in tups: “ #for 循环 字典 

print (f'{ tup }:{ tups[tup]}') 

可 以 看 到 ， 此 处 用 for 循环 对 字典 的 处 理 看 起 来 有 一 些 繁杂 ,是 否 可 以 使 用 更 直观 的 方式 处 理 
字典 呢 ? 

还 记得 我 们 前 面 学 习 的 序列 解 包 吗 ? for 循环 的 一 大 好 处 是 可 以 在 循环 中 使 用 序列 解 包 ， 例 如 
(for items.py) : 


tups={'name' ; ' 小 智 ', 'number' : '1002'} 
for key,value in tups.items(): 
print (f'{key}:{value}') 


输出 结果 如 下 : 


number:1002 
name :小 智 


由 输入 代码 和 输出 结果 看 到 ， 可 以 使 用 items 方法 将 键 - 值 对 作为 元 组 返 





五 








字典 中 的 元 素 是 没有 顺序 的 。 也 就 是 说 ， 和 迭代 时 字典 中 的 键 和 值 都 能 保证 被 处 理 ， 但 是 处 
理 顺 序 不 确定 。 这 也 是 用 for 循环 输出 字典 中 的 元 素 时 不 按照 顺序 输出 的 原因 。 
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6.6.4 ”迭代 工具 


在 Python 中 ， 和 迭代 序列 或 其 他 可 迁 代 对 象 时 ， 有 一 些 函 数 非常 有 用 。 下 面 我 们 介绍 一 些 有 用 
的 函数 。 

1. 并 行 迭 代 

程序 可 以 同时 迭代 两 个 序列 ， 输 入 如 下 (iterative_use.py): 

#! /usr/bin/python3 


#-*= coding:UTF-8 一 * 一 


student=['xiaomeng','xiaozhi', 'xiaoqiang'] 
number=[1001, 1002, 1003] 
for i in range(len(student)): 

Print (f'{student [i] } 的 学 号 是 : {number [i]}') 


旦 序 执行 结果 如 下 : 

xiaomeng 的 学 号 是 1001 

xiaozhi 的 学 号 是 ，1002 

xiaoqiang 的 学 号 是 : 1003 

在 程序 中 ，i 是 循环 索引 的 标准 变量 名 。 

在 Python 中 ， 内 建 的 zip 函数 用 来 进行 并 行 迭 代 ， 可 以 把 两 个 序列 合并 在 一 起 ， 返 回 一 个 元 
组 的 列表 ， 例 如 (zip_fune_use.py): 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 














student=['xiaomeng','xiaozhi', 'xiaoqiang'] 

number=[1001, 1002, 1003] 

for name,num in zipl(student,number): 

print (f' {name} 的 学 号 是 {num} ') 

程序 执行 结果 和 前 面 一 样 。 

zip 函数 可 以 作用 于 任意 数量 的 序列 ， 并 且 可 以 应 付 不 等 长 的 序列 ， 当 短 序列 “用 完 ” 时 就 会 
停止 ,例如 (zip_exp.py) : 

#! /usr/bin/python3 


#=*= codsngs UTP-8 =*= 


for numl,num2 in zip(range(3),range(100)): 
print (f'zip 键 值 对 为 : {numl} {num2}') 


程序 执行 结果 如 下 : 
zip 键 值 对 为 : 0 0 
zip 键 值 对 为 : 1 1 
zip 键 值 对 为 : 2 2 


由 输出 结果 看 到 ，zip 函数 以 短 序列 为 准 ， 当 短 序 列 遍历 结束 时 ，for 循环 就 会 遍历 结束 。 
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此 处 用 到 的 range 函数 是 Python 3 中 的 函数 ,在 Python 2 版 本 中 存在 与 这 个 函数 功能 类 似 的 
xrange 函数 。 


2. 翻转 和 排序 迭代 





我 们 在 列表 中 学 习 过 reverse 和 sort 方法 ， 此 处 介绍 两 个 类 似 的 函数 一 一 reversed 和 sorted 函 
数 。 这 两 个 函数 可 作用 于 任何 序列 或 可 帮 代 对 象 ， 但 不 是 原 地 修改 对 象 ， 而 是 返回 翻转 或 排序 后 的 





版 本 。 在 交互 模式 下 输入 : 


>>> sorted([5,3,7,1]) 

3 

>>> sorted('hello,world!') 

nO We vl My Ad Oy MO se 
>>> list (reversed('hello,world!')) 

Embree es op Ou UM oy Oe ay 
>>> ''.join(reversed('hello,world!')) 

'!dlrow,olleh' 





由 输出 结果 我 们 看 到 ，sorted 函数 返回 的 是 一 个 列表 ,reversed 函数 返回 的 是 一 个 可 迭代 对 象 。 
它们 的 具体 含义 不 用 过 多 关注 ,在 for 循环 和 join 方法 中 使 用 不 会 有 任何 问题 。 如 果 要 对 这 两 个 函 


数 使 用 索引 、 分 片 及 调用 list 方法 ， 就 可 以 使 用 list 类 型 转换 返回 对 象 。 


6.6.5 ”跳出 循环 


我 们 在 前 面 的 示例 中 讲 过 ， 循 环 会 一 直 执 行 ， 直 到 条 件 为 假 或 序列 元 素 用 完 时 才 会 结束 。 


车 


我 们 想 提前 中 断 循 环 ， 比 如 循环 的 结果 已 经 是 我 们 想 要 的 了 ,不想 让 循环 继续 执行 而 占用 资源 ， 有 


什么 方法 可 以 实现 呢 ? 
Python 提供 了 break、continue 等 语句 可 用 于 这 种 情形 。 
1. break 


break 语句 用 来 终止 循环 语句 ， 即 使 循环 条 件 中 没有 False 条 件 或 序列 还 没有 遍历 完 ， 也 会 


止 执 行 循环 语句 。 
break 语句 用 在 while 和 for 循环 中 。 
如 果 使 用 嵌 套 循环 ，break 语句 就 会 停止 执行 最 深层 的 循环 ， 并 开始 执行 下 一 行 代码 。 
break 语句 语法 如 下 : 
break 
break 语句 的 执行 流程 如 图 6-9 所 示 。 
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conditional 
code 






f condition 
is true 


condition 







fcondition 
is false 


图 6-9 break 执行 流程 
当 遇 到 break 语句 时 ， 无 论 执行 什 么 条 件 ， 都 跳出 这 个 循环 ， 例 如 (break_use.py) : 


#! /usr/bin/python3 


#-*- coding:UTF-8 -*— 


for letter in 'hello': # 示 例 1 
if letter == '1': 
break 


print (f' 当 前 字母 为 : {letter}') 


num = 10 # 示 例 2 
while num > 0: 
print (f' 输 出 数字 为 : {num}') 
num -= 1 
if num == 8: 
break 


输出 结果 如 下 : 

当前 字母 为 : h 

当前 字母 为 : e 

输出 数字 为 : 10 

输出 数字 为 : 9 

由 输出 结果 看 到 ， 在 示例 1 中 ， 输 出 语句 输出 循环 遍历 到 的 字符 ， 当 遇 到 指定 字符 时 ， 跳 出 
for 循环 。 在 示例 2 中 ， 使 用 while 做 条 件 判定 ， 在 语句 块 中 输出 满足 条 件 的 数字 ， 当 数字 等 于 8 
时 ， 跳 出 while 循环 ， 不 再 继续 遍历 。 

2. continue 

continue 语句 用 来 告诉 Python 跳 过 当前 循环 的 剩余 语句 ， 然 后 继续 进行 下 一 轮 循环 。 

continue 语句 用 在 while 和 for 循环 中 。 

continue 语句 的 语法 格式 如 下 : 
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continue 

continue 语句 的 执行 流程 如 图 6-10 所 示 。 

当 执 行 过 程 中 遇 到 continue 语句 时 , 无论 执行 条 件 是 
真 还 是 假 ， 都 跳 过 这 次 循环 ， 进 入 下 一 次 循环 ， 例 如 


(continue use.py) : 











#! /usr/bin/python3 
#-*- coding:UTF-8 -*— 


conditional 
code 





for letter in 'hello': # 示例 1 f condition continue 
if letter == "1': is true 
continue 


condition 


print (f' 当前 字母 : {letter}') 


num = 3 # 示例 2 


If condition 
while num > 0: 


is false 
num -= 1 


if num == 2: 
continue 


print (f' 当 前 变量 值 : {num}') 
输出 结果 如 下 : 


当前 字母 : h 
当前 字母 : e 
当前 字母 : o 
当前 变量 值 : 1 
当前 变量 值 : 0 


由 输出 结果 看 到 ， 相 比 于 break 语句 ， 使 用 continue 语句 只 是 跳 过 一 次 循环 ， 不 会 跳出 整个 循环 。 


图 6-10 continue 执行 流程 


6.6.6 ”循环 中 的 else 子 句 


在 开发 过 程 中 , 可 能 需要 在 while、for 等 循环 不 满足 条 件 时 做 一 些 工 作 。 该 怎么 实现 呢 ? 下 面 
进行 介绍 。 

1. 在 while 循环 中 使 用 else 语句 

在 while 条 件 语 句 为 false 时 ， 执 行 else 的 语句 块 ， 例 如 (while_else_use.py) : 


#! /usr/bin/python3 
#-*- coding:UTF-8 —*- 


num = 0 
while num < 3: 

print (f"{num} 小 于 3") 

num += 1 
else: 

print (f"{num} 大 于 或 等 于 3") 
print ("结束 循环 !") 


执行 结果 如 下 : 
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0 小 于 3 
3 
| 
3 ”大 于 或 等 于 3 
结束 循环 ! 


由 输出 结果 看 到 ，while 循环 结束 后 执行 了 else 语句 中 的 语句 块 ， 输 出 “3 大 于 或 等 于 3” 语 句 。 

2. 在 for 循环 中 使 用 else 语句 

在 for 条 件 语句 为 false 或 结束 后 没有 被 break 中 断 时 ， 执 行 else 的 语句 块 ， 例 如 
(for else use.py) : 

#! /usr/bin/python3 


#-*- coding:UTF-8 —*— 


names = ['xiaomeng', 'xiaozhi'] 
for name in names: 
if name == "xiao": 
print (f" 名 称 : {name}") 
break 
Print (f" 循 环 名 称 列表 {name}") 
else: 
print ("没有 循环 数据 !") 
print ("结束 循环 !") 


程序 执行 结果 如 下 : 


循环 名 称 列表 xiaomeng 
循环 名 称 列表 xiaozhi 
没有 循环 数据 ! 

结束 循环 ! 


由 输出 条 件 看 到 ，for 循环 结束 后 执行 了 else 语句 块 中 的 内 容 。 
6.7 pass 语 句 


Python 中 的 pass 是 空 语句 ， 作 用 是 保持 程序 结构 的 完整 性 。 
pass 语句 的 语法 格式 如 下 : 


pass 
pass 不 做 任何 事情 ， 只 是 占 位 语句 ， 例 如 : 


>>> pass 
>>> 


输出 结果 什么 都 没有 做 。 
为 什么 使 用 一 个 什么 都 不 做 的 语句 呢 ? 再 来 看 如 下 代码 (exp_normalpy) : 


#! /usr/bin/python3 
#-*- coding:UTF-8 —*- 
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name='xiaomeng" 


if name == 'xiaomeng': 
print ('hello') 
elif name == 'xiaozhi': 


# 预 留 ， 先 不 做 任何 处 理 


else: 


print ('nothing') 


执行 程序 ， 结 果 如 下 : 


File 


"itertor.py", line 63 


else: 


IndentationError: expected an indented block 
执行 报错 了 ， 因 为 程序 中 有 空 代码 ， 在 Python 中 空 代码 是 非法 的 。 解 决 办 法 是 在 语句 块 中 加 
一 个 pass 语句 。 上 面 的 代码 更 改 为 (pass_use.py) : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*— 


name='xiaomeng' 

if name == 'xiaomeng': 
print ('hello') 

elif name == 'xiaozhi': 
# 预 留 ， 先 不 做 任何 处 理 


pass 


else: 


print ('nothing') 


再 执行 这 段 代 码 ， 得 到 结果 如 下 : 

















hello 
输出 结果 可 以 正确 执行 了 。 
汪 dd 
6.8 “牛刀 小 试 一 一 猜 字 游 戏 编写 

为 巩固 本 章 的 学 习 内 容 ， 设 计 一 个 小 游戏 帮助 我 们 系统 地 温习 本 章 的 知识 点 。 

游戏 内 容 是 这 样 的 : 随便 给 定 一 个 在 一 定 范围 内 的 数字 ， 让 用 户 去 猜 这 个 数字 是 多 少 ， 并 输 
入 自己 猜测 的 数字 ， 系统 判断 是 否 为 给 定数 字 。 如 果 输 入 的 猜测 数字 大 于 给 定 值 ， 提 示 你 输入 的 值 
大 了 ; 如 果 输 入 的 值 小 于 给 定 值 ， 就 提示 输入 的 值 小 了 ; 如 果 等 于 给 定 值 ， 就 提示 你 猜 对 了 ， 并 展 
示 总 共 猜 了 多 少 次 。 

在 看 参考 代码 之 前 先 思考 一 下 ， 要 实现 这 个 小 游戏 ， 你 会 怎么 做 呢 ? 

思考 点 拨 : 


先 从 最 简单 的 方向 思考 ， 有 3 种 情况 : 
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(1) 输入 值 小 于 给 定 值 。 
(2) 输入 值 等 于 给 定 值 。 
(3) 输入 值 大 于 给 定 值 。 
对 于 情况 (1) 和 (3) ， 需 要 继续 输入 ; 对 于 情况 (2) ， 输 入 结束 。 

需要 提供 3 个 变量 : 一 个 变量 用 于 记录 给 定 值 ， 一 个 变量 用 于 记录 输入 值 ， 还 有 一 个 变量 用 
于 记录 输入 了 多 少 次 ， 注 意 输 入 次 数 至 少 是 一 次 。 

参考 代码 如 下 (参考 代码 对 输入 元 素 是 否 为 数字 做 了 判断 ， 同 时 判断 了 输入 数字 是 否 超出 给 
定 的 数值 范围 ，num_guess.py) : 


#! /usr/bin/python3 
#-*- coding:UTF-8 一 * 一 




















import random 


number = random.randint (1,100) 
guess = 0 
while True: 
num input = input ("请 输入 一 个 1 到 100 的 数字 :") 
guess +=1 
if not num input.isdigit(): 
print ("请 输入 数字 。") 
elif int(num input)<0 or int(num input)>=100: 
Print ("输入 的 数字 必须 介 于 1 到 100。") 
else: 
if number==int (num _ input) : 
Print (f" 苏 喜 您 ， 您 猜 对 了 ， 您 总 共 猜 了 {guess} 次 ") 
break 
elif number>int (num input): 
print ("您 输入 的 数字 小 了 。") 
elif number<int (num input): 
print ("您 输入 的 数字 大 了 。") 
else: 


print ("系统 发 生 不 可 预测 问题 ， 请 联系 管理 人 员 进 行 处 理 。") 


6.9 “Python 程序 调试 


这 里 通过 设置 一 些 错误 让 读者 认识 在 编写 代码 过 程 中 的 常见 问题 ， 以 帮助 读者 熟悉 和 解决 实 
际遇 到 的 问题 。 

(1) 在 交互 模式 下 输入 false， 看 会 输出 什么 结果 ， 并 尝试 解答 为 什么 输出 这 样 的 结果 。 输 入 
true、true+false 呢 ? 


>>> false 

Traceback (most recent call last) : 
File "<stdin>", line 1, in <module> 

NameError: name 'false' is not defined 


(2) 在 while 或 for 循环 中 , 尝试 不 对 齐 循环 语句 块 中 的 语句 , 看 看 执行 结果 是 怎样 的 ? 例如 : 
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#! /usr/bin/python3 
#-*- coding:UTF-8 -—*- 


num = 10 
while num > 0: 
print (' 输 出 数字 为 :'，num) 
num -= 1 # 本 行 与 其 他 行 不 对 齐 
if num == 8: 
break 


运行 这 段 代码 ， 查 看 输出 结果 是 怎样 的 ， 并 尝试 更 改 为 for 循环 ， 再 次 查看 结果 。 
(3) 尝试 以 下 程序 的 执行 结果 : 
#! /usr/bin/python3 


#-*— coding:UTF-8 一 * 一 


name='xiaomeng' 

if name == 'xiaomeng': 
Print ('hello') 

elif name == "xiaozhi' : 
Print('do nothing') 

Pass 

else: 

print ('nothing') 


6.10 ”问题 解答 


(1) 能 不 能 像 执 行 .exe 文件 一 样 执行 .py 文件 呢 ? 

答 : 在 Windows 上 是 不 行 的 ， 不 过 在 Mac 和 Linux 上 可 以 。 方 法 是 在 .py 文件 的 第 一 行 加 一 
个 特殊 注释 ， 例 如 : 

#!/usr/bin/env python3 

(2) 在 实际 项 目 中 ， 条 件 语句 用 得 多 还 是 循环 语句 用 得 多 ? 

答 : 这 要 看 什么 样 的 项 目 ， 有 一 些 项 目的 功能 用 条 件 语句 更 好 实现 ， 条 件 语句 就 会 用 得 多 些 。 
若 使 用 循环 语句 实现 更 方便 , 就 多 使 用 循环 语句 。 随 着 越 来 越 熟悉 这 些 语 句 , 可 以 根据 自己 的 使 用 
习惯 和 具体 需求 做 出 更 好 的 选择 。 

(3) 可 以 在 循环 语句 中 其 套 循环 吗 ? 

答 : 可 以 ,循环 语句 也 可 以 像 条 件 语句 一 样 嵌 套 循环 语句 。 循 环 语句 不 但 可 以 嵌 套 循环 语句 ， 
而 且 可 以 嵌 套 条 件 语 句 ， 条件 语 句 中 也 可 以 嵌 套 循环 语句 。 条 件 语句 和 循环 语句 的 使 用 很 灵活 ， 只 
要 语法 正确 ， 就 可 以 任意 使 用 。 
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6.11 温 故 知 新 ， 学 以 致 用 





本 章 主 要 讲解 了 条 件 、 循 环 和 其 他 语句 ， 在 本 章 结 束 前 回顾 一 下 学 到 的 概念 。 


(1) import 语句 和 import 语句 的 使 用 。 

(2) 什么 是 序列 解 包 、 链 式 赋值 和 增 量 赋值 ? 

(3) 什么 是 条 件 语 句 ? 

(4) 有 哪些 循环 语句 ， 该 怎么 使 用 ， 又 该 怎么 跳出 ? 


思考 并 解决 如 下 问题 : 


(1) 使 用 import 导入 随机 函数 ， 并 用 导入 的 随机 函数 生成 随机 数 。 

(2) a=2，b=5， 不 借用 其 他 变量 ， 交 换 a、b 的 值 。 

(3) 编写 代码 实现 : 如果 输入 的 数字 大 于 某 个 值 ， 则 做 事情 A， 和 否则 做 事情 B。 

(4) 编写 代码 实现 多 区 间 数 值 的 流程 判定 ， 即 满足 区 间 A， 做 事情 A; 满足 区 间 B， 做 事情 
B; 满足 区 间 C， 做 事情 C， 等 等 。 

(5) 用 while 循环 实现 : 给 定 a=1， 当 a 小 于 100 时 ， 则 a=a*(a+l)。 

(6) 用 for 循环 实现 冒 泡 排序 。 

(7) 用 while 循环 实现 当 满 足 某 一 条 件 时 ， 跳 出 循环 ， 否 则 循环 结束 后 ， 打 印 出 没有 满足 某 
一 条 件 的 事情 发 生 。 

(8) 用 for 循环 结合 continue 和 break, 从 一 个 数据 列表 中 最 快 找到 最 接近 某 个 给 定数 字 的 数 。 

(9) 使 用 本 章 的 知识 写 一 个 程序 ， 判 断 输 入 的 年 份 是 否 为 头 年 输入 函数 为 input) 。 

(10) 写 一 个 函数 ， 判 断 输入 的 数字 是 奇数 还 是 偶数 。 

(11) 阿姆斯特朗 数 。 如 果 一 个 n 位 正 整 数 等 于 各 位 数字 n 次 方 的 和 ， 就 称 该 数 为 阿 姆 斯 特 
朗 数 。 例 如 ，1^3 + S^3 +3^3=153。 

1000 以 内 的 阿姆斯特朗 数 有 : 1、2、3、4、5、6、7、8、9、153、370、371、407。 

写 一 个 程序 ， 检 测 输入 的 数字 是 否 为 阿姆斯特朗 数 。 
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代码 实例 








函数 是 组 织 好 的 、 可 重复 使 用 的 、 用 来 实现 单一 或 相关 联 功能 的 代码 段 。 
函数 能 够 提高 应 用 的 模块 性 和 代码 的 重复 利用 率 。Python 提 供 了 许多 内 建 函 数 ,如 print()、int()。 
读者 也 可 以 自己 创建 函数 ， 这 样 的 函数 称 为 用 户 自 定义 函数 。 


7.1 调用 函数 


在 程序 设计 中 ， 函 数 是 指 用 于 进行 某 种 计算 的 一 系列 语句 的 有 名 称 的 组 合 。 定 义 函数 时 ， 需 
要 指定 函数 的 名 称 并 编写 一 系列 程序 语句 ， 之 后 可 以 使 用 名 称 “调用 ”这 个 函数 。 

前 面 我 们 已 经 介绍 过 函数 调用 ， 例 如 : 

>>> print('hello world') 

hello world 

>>> type('hello') 

<class 'str'> 

> nb) 

12 

以 上 代码 就 是 函数 的 调用 。 函 数 括号 中 的 表达 式 称 为 函数 的 参数 。 了 函数“ 接收” 参数， 并 “ 返 
可 ”结果 ， 这 个 结果 称 为 返回 值 (return value) 。 比 如 上 面 示例 中 的 int(12.1)，12.1 就 是 “接收 ” 
的 参数 ， 得 到 的 结果 是 12，12 就 是 返回 值 。 

Python 3 内 置 了 很 多 有 用 的 函数 ,可 以 直接 调用 。 要 调用 一 个 函数 ,就 需要 知道 函数 的 名 称 和 
参数 ， 比 如 求 绝 对 值 的 函数 abs 只 有 一 个 参数 。 可 以 直接 从 Python 的 官方 网 站 查看 文档 : 




















https://docs.python.org/3.7/library/functions.html 
进入 官方 网 站 可 以 看 到 如 图 7-1 所 示 的 页 面 ， 这 里 显示 了 Python 3 内 置 的 所 有 函数 ，abs() 函 
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数 在 第 一 个 。 从 左上 角 可 以 看 到 这 个 函数 是 Python 3.7 版 本 的 内 置 函数 。 
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图 7-1 Python 官方 网 站 


单 击 abs() 函 数 ， 页 面 会 跳 转 到 如 图 7-2 所 示 的 位 置 ， 有 对 abs() 函 数 的 说 明 。 截 图 中 的 意思 是 : 


返回 一 个 数 的 绝对 值 。 参 数 可 能 是 整数 或 浮 点 数 。 如 果 参 数 是 一 个 复数 ， 就 返回 它 的 大 小 。 


abs(x) 


Return the absolute value of a number The argument may be an integer or a floating point number If he argument is a complex number its 
magnitude is retuned 





图 7-2 abs() 函 数 帮 助 说 明 
除了 到 Python 官方 网 站 查看 文档 外 ， 还 可 以 在 交互 式 命令 行 通过 help(abs) 查 看 abs 函数 的 帮 


助 信息 。 在 交互 模式 下 输入 : 


>>> help (abs) 
Help on built-in function abs in module builtins: 
abs(x, /) 

Return the absolute value of the argument. 


可 以 看 到 ， 输 出 了 对 应 的 帮助 信息 ， 但 是 没有 官方 网 站 的 详细 。 
下 面 实际 操作 abs0 函 数 ， 在 交互 模式 下 输入 : 


>>> abs (20) 
20 

>>> abs (-20) 
20 

>>> abs(3.14) 
3.14 

>>> abs (-3.14) 
3.14 


从 上 面 的 输出 结果 可 以 看 出 ，abs 函数 用 于 求 绝对 值 。 
调用 abs() 函 数 时 ， 如 果 传 入 的 参数 数量 不 对 ， 就 会 报 TypeError 的 错误 ，Python 会 明确 告诉 


: abs() 有 且 只 有 一 个 参数 ， 但 给 出 了 两 个 ， 例 如 : 


>>> abs (5, 6) 





Traceback (most recent call last) : 
File "<stdin>", line 1, in <module> 
TypeError: abs() takes exactly one argument (2 given) 
如 果 传 入 的 参数 数量 是 对 的 ， 但 参数 类 型 不 能 被 函数 接收 ， 也 会 报 TypeError 的 错误 。 给 出 错 
误 信息 : str 是 错误 的 参数 类 型 ， 例 如 : 
>>> abs('hello') 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
TypeError: bad operand type for abs(): 'str' 


函数 名 其 实 是 指向 一 个 函数 对 象 的 引用 ， 完 全 可 以 把 函数 名 赋 给 一 个 变量 ， 相 当 于 给 这 个 函 
数 起 了 一 个 “别名 ”， 在 交互 模式 下 输入 : 


>>> fun=abs # 变量 fun 指向 abs 函数 
>>> fun(-5) # 所 以 可 以 通过 fun 调用 abs 函数 


5 

>>> fun(-3.14) # 所 以 可 以 通过 fun 调用 abs 函数 
3.14 

>>> fun(3.14) # 所 以 可 以 通过 fun 调用 abs 函数 
Ev 


调用 Python 中 的 函数 时 ， 需 要 根据 函数 定义 传 入 正确 的 参数 。 如 果 函 数 调用 出 错 ， 就 要 会 看 
错误 信息 ， 这 时 就 要 考验 你 的 英语 水 平 了 。 


7.2 定义 函数 


到 目前 为 止 ,我 们 用 的 都 是 Python 内 署 函 数 。 这 些 Python 内 置 函数 的 定义 部 分 对 我 们 来 说 是 
透明 的 。 因 此 ， 我 们 只 需 关 注 这 些 函数 的 用 法 ， 而 不 必 关 心 函数 是 如 何 定义 的 。Python 支持 自 定 
义 函 数 ， 即 由 我 们 自己 定义 一 个 实现 某 个 功能 的 函数 。 下 面 是 自 定义 函数 的 简单 规则 。 

(1) 函数 代码 块 以 def 关键 词 开头 ， 后 接 函 数 标识 符 名 称 和 圆 括号 “0”。 

(2) 所 有 传 入 的 参数 和 自 变量 都 必须 放 在 圆 括号 中 ， 可 以 在 圆 括号 中 定义 参数 。 

(3) 函数 的 第 一 行 语句 可 以 选择 性 使 用 文档 字符 串 ， 用 于 存放 函数 说 明 。 

(4) 函数 内 容 以 冒号 开始 ， 并 且 要 缩 进 。 

(5) return [表达 式 ] 结束 函数 ， 选 择 性 返回 一 个 值 给 调用 方 。 不 带 表 达 式 的 return 相当 于 返 
回 None。 


Python 定义 函数 使 用 def 关键 字 ， 一 般 格 式 如 下 : 


def 函数 名 (参数 列表 ): 
函数 体 


或 者 更 直观 地 表示 为 : 


def <name> (argl, arg2,... argN): 
<statements> 
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函数 的 名 字 必 须 以 字母 开头 ， 可 以 包括 下 画 线 “_”。 和 定义 变量 一 样 ， 不 能 把 Python 的 关键 字 
定义 成 函数 的 名 字 。 函 数 内 的 语句 数量 是 任意 的 ， 每 个 语句 至 少 有 一 个 空格 的 缩 进 ， 以 表示 该 语句 属 
于 这 个 函数 。 函 数 体 必须 保持 缩 进 一 致 ， 因 为 在 函数 中 ， 缩 进 结束 就 表示 函数 结束 。 

现在 已 经 知道 定义 函数 的 简单 规则 和 一 般 格式 了 。 下 面 我 们 进行 实际 操作 ， 在 文本 中 定义 函 
数 并 调用 〈func_define.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 一 “一 





def hello(): 
print ('hello,world') 


hello() 

以 上 示例 中 的 hello() 就 是 我 们 自 定义 的 函数 。 此 处 为 了 看 到 执行 结果 ， 在 函数 定义 完 后 做 了 
函数 的 自我 调用 。 如 果 不 自我 调用 ,执行 该 函数 就 没有 任何 输出 ， 当 然 也 不 会 报错 (除非 代码 有 问 
题 ) 。 

在 cmd 命令 下 执行 以 上 .py 文件 ， 执 行 结果 如 下 : 

hello,world 

需要 注意 以 下 几 点 : 

(1) 没有 retum 语 名 时， 函数 执行 完毕 也 会 返回 结果 ， 不 过 结果 为 None。 

(2) return None 可 以 简写 为 return。 

(3) 在 Python 中 定义 函数 时 ， 需 要 保持 函数 体 中 同一 层级 的 代码 缩 进 一 致 。 

根据 以 上 示例 , 是 不 是 一 个 函数 中 只 能 有 一 条 语句 呢 ? 除了 输出 操作 , 还 能 执行 其 他 操作 吗 ? 

在 一 个 函数 中 可 以 输出 多 条 语句 ， 并 能 做 相应 的 运算 操作 ， 以 及 输出 运算 结果 。 

例如 ， 定 义 输出 多 条 语句 的 函数 并 执行 〈print_ more.py) : 

#! /usr/bin/python3 


# -*- coding:UTF-8 -*— 


def print more(): 
print (' 该 函数 可 以 输出 多 条 语句 ， 我 是 第 一 条 。' ) 
print (' 我 是 第 二 条 ') 
print (' 我 是 第 三 条 ') 


Print_more () # 调 用 函数 

执行 结果 如 下 : 

该 函数 可 以 输出 多 条 语句 ， 我 是 第 一 条 。 

我 是 第 二 条 

我 是 第 三 条 

定义 输出 数字 和 计算 的 函数 并 执行 (mix_operation.py) : 


#! /usr/bin/python3 
= odingrr0 = 








def mix operation(): 
a=10 
b=20 
print (a) 
print (b) 
print (a+b) 
print (f'a+b 的 和 等 于 : {a+b}') 


mix_operation()  # 调 用 函数 


执行 结果 如 下 : 


a+b 的 和 等 于 : 30 

以 上 示例 验证 了 前 面 的 内 容 。 

定义 一 个 什么 都 不 做 的 函数 可 以 吗 ? 当然 可 以 。 如 果 想 定义 一 个 什么 都 不 做 的 空 函 数 ， 可 以 
用 pass 语句 ， 定 义 如 下 函数 并 执行 (do_nothing.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 一 * 一 





def do nothing(): 
pass 


do_nothing() 

执行 结果 为 没有 任何 输出 。 

pass 语句 什么 都 不 做 ， 有 什么 用 呢 ? 实际 上 pass 可 以 作为 占 位 符 ， 比 如 现在 还 没 想 好 怎么 写 
函数 的 代码 ， 可 以 先 放 一 个 pass， 让 代码 能 运行 起 来 。 

函数 的 目的 是 把 一 些 复杂 操作 隐藏 起 来 ， 用 于 简化 程序 的 结构 ， 使 程序 更 容易 阅读 。 函 数 在 
调用 前 必须 先 定义 。 


7.3 ”水 数 的 参数 


我 们 在 7.2 节 中 讲述 了 如 何 定义 函数 , 不 过 只 讲述 了 定义 简单 函数 , 还 有 一 类 函数 是 带 参数 的 ， 
称 为 带 参 数 的 函数 。 本 节 将 探讨 如 何 定义 带 参数 的 函数 及 其 使 用 。 

调用 函数 时 可 以 使 用 以 下 参数 类 型 : 

(1) 必须 参数 。 

(2) 关键 字 参 数 。 

(3) 默认 参数 。 

(4) 可 变 参数 。 

(5) 组 合 参数 。 
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下 面 我 们 分 别 进行 介绍 。 


7.3.1 ”必须 参数 


必须 参数 必须 以 正确 的 顺序 传 入 函数 。 调 用 时 数量 必须 和 声明 时 一 样 。 比 如 需要 传 入 a、b 两 
个 参数 ， 就 必须 以 a、b 的 顺序 传 入 ， 不 能 以 b、a 传 入 ， 即 使 不 报错 ， 也 会 导致 结果 的 错误 。 
定义 如 下 函数 并 执行 (param_one.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 一 * 一 





def param one(val str): 
print(f'the param is:{val str}') 


print (f£' 我 是 一 个 传 入 参数 ， 我 的 值 是 : {val_str}') 
Param one('hello,world') 


执行 结果 如 下 : 


the param is: hello,world 
我 是 一 个 传 入 参数 ， 我 的 值 是 hello, world 


我 们 定义 了 一 个 必须 传 入 一 个 参数 的 函数 param_one(val_str)， 传 入 的 参数 为 val_str， 结 果 是 
将 “hello,world” 传 给 val_str。 

对 于 上 例 ， 若 不 传 入 参数 或 传 入 一 个 以 上 的 参数 ， 结 果 会 怎样 呢 ? 例如: 

param_one() ”# 不 输入 参数 

执行 结果 如 下 : 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: param one() missing 1 required positional argument: 'val_str' 


执行 结果 告诉 我 们 ， 函 数 缺少 一 个 必需 的 定位 参数 ， 参 数 类 型 为 val_str。 
paramone ('hello', 'world') “# 输 入 超过 一 个 参数 


执行 结果 如 下 : 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: param one() takes 1 positional argument but 2 were given 


执行 结果 告诉 我 们 ， 函 数 只 需 一 个 位 置 参 数 却 给 了 两 个 。 
通过 示例 可 以 看 到 ， 对 于 定义 的 param_one() 函 数 ， 不 传 入 参数 或 传 入 一 个 以 上 参数 ， 都 会 报 
错 。 所 以 对 于 此 类 函数 ， 必 须 传递 对 应 正确 个 数 的 参数 。 


7.3.2 ”关键 字 参 数 


关键 字 参 数 和 函数 调用 关系 紧密 ， 函 数 调用 使 用 关键 字 参 数 确定 传 入 的 参数 值 。 
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使 用 关键 字 参 数 允 许 调用 函数 时 参数 的 顺序 与 声明 时 不 一 致 , 因为 Python 解释 器 能 够 用 参数 
名 匹配 参数 值 。 
定义 如 下 函数 并 执行 (person_info.py) : 


#! /usr/bin/python3 
得 -*=- coding:UTF-8 -=*— 





def person infol(age,name): 
print (f' 年 龄 ，{age}') 
print (f' 名 称 : {name}') 
return 


print (0------- 按 参数 顺序 传 入 参数 ------- 1) 
person_info (21, ' 小 萌 ') 

让 不 按 参 数 顺 序 传 入 参数 ， 指 定 参数 名 -------') 
person_info (name=' 小 萌 ' ,age=21) 

Print ('———-——-: 按 参 数 顺序 传 和 参数， 并 指定 参数 名 -------") 


person_info (age=21,name=' 小 萌 ') 


调用 函数 执行 结果 如 下 : 


年 龄 : 21 
名 称 : 小 萌 


年 龄 : 21 
名 称 : 小 萌 


年 龄 : 21 

名 称 : 小 萌 

由 以 上 输出 结果 可 以 看 到 ， 对 于 person_info() 函 数 ， 只 要 指定 参数 名 ,输入 参数 的 顺序 对 结果 
就 没有 影响 ， 都 能 得 到 正确 的 结果 。 


7.3.3 ”默认 参数 


调用 函数 时 ， 如 果 没 有 传递 参数 ， 就 会 使 用 默认 参数 。 

使 用 默认 参数 ， 就 是 在 定义 函数 时 ， 给 参数 一 个 默认 值 。 如 果 没 有 给 调用 的 函数 的 参数 赋值 ， 
调用 的 函数 就 会 使 用 这 个 默认 值 。 

例如 ， 定 义 如 下 函数 并 执行 default_param.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 -*-— 


def default param(name, age=23): 
print (f'hi， 我 则 : {name}') 
Print (f' 我 今年 : {age}') 
return 


default_param(' 小 萌 ') 


调用 函数 执行 结果 如 下 : 
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hi, 我 叫 ， 小 萌 
我 今年 : 23 
从 以 上 示例 我 们 看 到 , 在 调用 函数 时 没有 对 age 赋值 , 在 输出 结果 中 使 用 了 函数 定义 时 的 默认 
值 。 如 果 我 们 对 age 赋值 ， 最 后 输出 的 结果 会 使 用 哪个 值 呢 ? 
重新 调用 上 面 的 函数 : 
default_param(' 小 萌 ',21) # 函 数 默 认 age=23 
得 到 的 执行 结果 如 下 : 
hi, 我 叫 ， 小 萌 
我 今年 ; 21 
通过 执行 函数 我 们 看 到 ， 执 行 结果 使 用 的 是 我 们 传 入 的 参数 。 由 此 得 知 : 当 对 默认 参数 传 值 
函数 执行 时 调用 的 是 我 们 传 入 的 值 。 
把 函数 的 默认 参数 放 在 前 面 是 否 可 行 呢 ? 定义 如 下 函数 并 执行 default_param_err.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 一 * 一 





于 


def default param err(age=23, name): 
Print (f'hi， 我 则 : {name}') 
Print (f' 我 今年 {age}') 
return 


default_param err(age=21,name=' 小 萌 ') 

执行 结果 如 下 : 

SyntaxError: non-default argument follows default argument 

执行 结果 是 编译 不 通过 ， 错 误 信息 是 : 非 默认 参数 跟 在 默认 参数 后 面 了 。 

这 里 提醒 我 们 ,默认 参数 一 定 要 放 在 非 默认 参数 后 面 。 如 果 需 要 多 个 默认 参数 ， 该 怎么 办 呢 ? 
我 们 看 以 下 几 个 函数 定义 的 示例 。 

示例 1: 默认 参数 在 必须 参数 前 (default_param_try.py) 

#! /usr/bin/python3 


# -*- coding:UTF-8 —*— 


def default param 1 (age=23, name, addr='shanghai'): 
print (f'hi， 我 则 : {name}') 
print (f' 我 今年 : {age}') 
print (f' 我 现在 在 : {addr}') 


return 


def default param 2(age=23, addr='shanghai', name): 
print (f'hi， 我 则 : {name}') 
print (f' 我 今年 : {age}') 
print (f' 我 现在 在 : {adar}') 


return 


default_param 1(age=23，' 小 戎 '，addr='shanghai') 
default_param 2(age=23，addr='shanghai'，' 小 萌 ') 
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执行 结果 如 下 报错 了 》: 


SyntaxError: non-default argument follows default argument 


示例 2: 更 改 默 认 参 数值 (default_param_test.pu) : 


#! /usr/bin/python3 
和 =*~ codingsUTF-8 =*= 


def default param(name, age=23, addr='shanghai'): 
Print (f'hi， 我 则 : {name}') 
print (f' 我 今年 : {age}') 
print (f' 我 现在 在 : {adar}') 
return 


Print ('======= 传 入 必须 参数 ------- 二 
default_param(' 小 萌 ') 

Perit 传 入 必须 参数 ， 更 改 第 一 个 默认 参数 值 ------- ") 
default_param(' 小 萌 ' 21) 


Print ('------- 传 入 必须 参数 ， 指 定 默认 参数 名 并 更 改 参 数值 ------- 
default_param(' 小 萌 '，addr='beijing') 

Prilnt("------- 传 入 必须 参数 ， 指 定 参数 名 并 更 改 值 ------- em 
default_param(' 小 萌 '，addr='beijing'，age=23) 

print ('------- 第 一 个 默认 参数 不 带 参数 名 ， 第 二 个 带 ------- 辐 ) 
default_param(' 小 萌 '，21,，addr='beijing') 

PE 两 个 默认 参数 都 带 参数 名 -一 ---- 和 
default_param(' 小 萌 '，age=23，addr='beijing') 

Print ('------- 第 一 个 默认 参数 带 参 数 名 ， 第 二 个 不 带 ， 报 错 ------- a 
default_param(' 小 萌 '，age=23， "beijing') 


执行 结果 如 下 : 


----- 一 传 入 必须 参数 一 --- 一 

hi， 我 叫 小 萌 

我 今年 ; 23 

我 现在 在 : shanghai 

----- 一 传 入 必须 参数 ， 更 改 第 一 个 默认 参数 值 ------- 
hi， 我 叫 小 萌 

我 今年 : 21 

我 现在 在 : shanghai 


hi, 我 叫 ， 小 萌 

我 今年 ;21 

我 现在 在 : beijing 

----- 一 传 入 必须 参数 ， 指 定 默认 参数 名 并 更 改 参数 值 ----- 一 - 
hi, 我 叫 ， 小 萌 

我 今年 : 23 

我 现在 在 : beijing 

=-- 一 - 一 - 传 入 必须 参数 ， 指 定 参数 名 并 更 改 值 -~------ 
hi, 我 叫 ， 小 萌 

我 今年 : 23 

我 现在 在 : beijing 

----- 一 -第 一 个 默认 参数 不 带 参数 名 ， 第 二 个 带 ---- 一 - 
hi, 我 叫 ， 小 萌 
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我 今年 21 
我 现在 在 : beijing 


hi, 我 叫 ， 小 萌 

我 今年 ， 23 

我 现在 在 : beijing 

二 第 一 个 默认 参数 带 参数 名 ， 第 二 个 不 带 ， 报 错 ------- 
SyntaxError: positional argument follows keyword argument 


从 以 上 执行 结果 可 以 发 现 : 


(1) 无 论 有 多 少 默认 参数 ， 默 认 参 数 都 不 能 在 必须 参数 之 前 。 

(2) 无 论 有 多 少 默认 参数 ， 若 不 传 入 默认 参数 值 ， 则 使 用 默认 值 。 

(3) 若 要 更 改 某 一 个 默认 参数 值 ， 又 不 想 传 入 其 他 默认 参数 ， 且 该 默认 参数 的 位 置 不 是 第 一 
个 ， 则 可 以 通过 参数 名 更 改 想 要 更 改 的 默认 参数 值 。 

(4) 若 有 一 个 默认 参数 通过 传 入 参数 名 更 改 参数 值 ， 则 其 他 想 要 更 改 的 默认 参数 都 需要 传 入 
参数 名 更 改 参 数值 ， 否 则 报错 。 

(5) 更 改 默认 参数 值 时 ， 传 入 默认 参数 的 顺序 不 需要 根据 定义 的 函数 中 的 默认 参数 的 顺序 传 
入 ， 不 过 最 好 同时 传 入 参数 名 ， 否 则 容易 出 现 执行 结果 与 预期 不 一 致 的 情况 。 

通过 以 上 示例 可 以 看 出 ， 默 认 参 数 是 比较 有 用 的 ， 通 过 默认 参数 可 以 帮助 我 们 少 写 不 少 代 码 ， 
比如 使 用 上 面 的 代码 帮助 某 单 位 录入 人 员 信 息 ， 如 果 有 很 多 人 的 addr 相同 ， 就 不 需要 传 入 每 个 人 
的 addr 值 了 。 不 过 使 用 默认 参数 时 需要 小 心 谨慎 。 


7.3.4 ”可 变 参数 


如 果 需 要 一 个 函数 能 够 处 理 更 多 的 声明 参数 ， 这 些 参 数 叫 作 可 变 参数 。 和 前 面 所 讲述 的 两 种 
参数 不 同 ， 可 变 参 数 声 明 时 不 会 命名 。 基 本 语法 如 下 : 


def functionname([formal args,] *var_args_tuple ): 
"函数 _ 文 档 字符 串 " 
function_ suite 


return [expression] 


加 了 星 号 (*) 的 变量 名 会 存放 所 有 未 命名 的 变量 参数 。 如 果 变 量 参数 在 函数 调用 时 没有 指定 
参数 ， 就 是 一 个 空 元 组 。 我 们 也 可 以 不 向 可 变 函 数 传递 未 命名 的 变量 。 

下 面 通过 实例 说 明 可 变 函 数 的 使 用 ， 定 义 如 下 函数 并 执行 (person_info_varpy) : 

#! /usr/bin/python3 


# -*- coding:UTF-8 -*- 


def person info var(arg, *vartuple): 
print (arg) 
for var in vartuple: 
print (f' 我 属于 不 定 长 参数 部 分 : {var}") 


return 


人 不 带 可 变 参 数 一 -= 一 一 ==")} 





person info_var(" 小 萌 ') 


Print 人 = 一 -一 一 -一 带 两 个 可 变 参数 一 -一 一 一 -一 一 -一 "小 
Person_info_var(' 小 萌 '，21， "beijing'") 

Print("——————-———— 带 5 个 可 变 参 数 一 -一 -一 -一 -一 一 由， 
person_info_var(' 小 萌 !，21， "beijing'，123， "shanghai'，"happy') 
执行 结果 如 下 : 

----- 一 ----- 不 带 可 变 参数 一 ---- 一 ---- 一 ---- 

小 萌 

------------ 带 两 个 可 变 参数 ---------------- 一 

小 彰 


我 属于 不 定 长 参数 部 分 : 21 

我 属于 不 定 长 参数 部 分 : beijing 

------------ 带 5 个 可 变 参数 ---------------- 

小 荫 

我 属于 不 定 长 参数 部 分 : 21 

我 属于 不 定 长 参数 部 分 : beijing 

我 属于 不 定 长 参数 部 分 : 123 

我 属于 不 定 长 参数 部 分 : shanghai 

我 属于 不 定 长 参数 部 分 : happy 

这 段 代码 看 起 来 很 不 可 思议 ， 在 定义 函数 时 只 定义 了 两 个 参数 ， 调 用 时 却 可 以 传 入 那么 多 参 
数 ， 难 道 该 函数 使 用 了 洪荒 之 力 ? 

这 其 实 就 是 可 变 参数 的 好 处 ， 我 们 在 参数 前 面 加 了 一 个 星 号 ， 在 函数 内 部 ， 参 数 前 的 星 号 将 
所 有 值 放 在 同一 个 元 组 中 ， 通 过 这 种 方式 将 这 些 值 收集 起 来 ， 然 后 使 用 。 参 数 vartuple 接收 的 是 一 
个 元 组 ， 调 用 函数 时 可 以 传 入 任意 个 数 的 参数 ， 也 可 以 不 传 。 

在 这 个 示例 中 使 用 了 前 面 所 学 的 for 循环 ， 通 过 for 循环 遍历 元 组 。 

通过 这 种 方式 定义 函数 ， 调 用 时 是 不 是 非常 方便 ? 我 们 在 后 续 学 习 中 会 经 常 遇 到 。 

也 可 以 使 用 这 种 方式 处 理 前 面 学 习 的 关键 字 参 数 ， 例 如 (per_info.py) : 

other = {' 城 市 ': ' 北 京 '，' 爱 好 ' : ' 编 程 ' } 

def per_ info(name, number, **kw): 

print (f' 名 称 : {name}) ,学 号 : {number}, 其 他 : {kw}') 


per_info(' 小 智 '，1002， 城 市 =other[' 城 市 '] ， 爱 好 =other[' 爱 好 ']) 

函数 执行 结果 为 : 

名 称 :小 智 ,学 号 :1002, 其 他 : {' 城 市 ': ' 北 京 '，' 爱 好 ' : ' 编 程 ' } 

由 函数 执行 结果 看 到 ， 可 以 使 用 两 个 “*” 号 ， 即 使 用 “**” 处 理 关 键 字 参数 。 函 数 调 用 时 可 
以 用 更 简单 的 方式 调用 ， 简 单 形式 如 下 : 

per_info(' 小 智 '，1002,，**other) 

函数 执行 结果 为 : 

名 称 :小 智 ,学 号 :1002, 其 他 : {' 城 市 ': ' 北 京 '，' 爱好 ' : ' 编 程 ' } 

执行 结果 和 前 面 一 样 ， 写 法 上 却 简单 了 不 少 。 此 处 **other 表示 把 other 这 个 字典 的 所 有 
key-value 用 关键 字 参 数 传 入 函数 的 **kw 参数 中 , kw 将 获得 一 个 字典 , 注意 kw 获得 的 字典 是 other 
复制 的 ， 对 kw 的 改动 不 会 影响 函数 外 的 other。 
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在 Python 中 定义 函数 可 以 用 必须 参数 、 关 键 字 参 数 、 默 认 参 数 和 可 变 关键 字 参 数 ， 这 4 种 参数 
可 以 组 合 使 用 。 注 意 定 义 参 数 的 顺序 必须 是 必须 参数 、 默 认 参数 、 可 变 参数 和 关键 字 参 数 。 

下 面 介绍 组 合 参数 的 使 用 ， 请 看 如 下 函数 定义 (exp.py) : 

#! /usr/bin/python3 

# -*- coding:UTE-8 —*— 


def exp(pl, p2, df=0, *vart, **kw): 
print (f'pl ={p1},p2={p2},df={df},vart={vart}, kw ={kw}') 


exp(1,2) 
exp(1,2,c=3) 
exp(1,2,3,'a','b') 
exp(1,2,3,'abc',x=9) 


函数 执行 结果 如 下 : 

P1 =1,p2=2,df=0, vart=(), kw ={} 

pl =1,p2=2,df=0,vart=(),kw ={'c': 3} 

pl =1,p2=2,df=3,vart=('a', 'b'),kw ={} 

Pl =1,p2=2,df=3,vart=('abc',),kw ={'x': 9} 

由 输出 结果 看 到 ， 使 用 了 组 合 参数 ， 在 调用 函数 时 ，Python 解释 器 会 自动 按照 参数 位 置 和 参 
数 名 把 对 应 的 参数 传 进去 。 
此 处 还 可 以 用 tuple 和 dict 调用 上 述 函数 ， 使 用 方式 如 下 : 











pl = 1,p2= 2,df- 3,vart= (kw =- ty': 9 x 8 器 有 
由 执行 结果 看 到 ， 任 意 函数 都 可 以 通过 类 似 func(*args,**kw) 的 形式 调用 ， 无 论 参数 是 如 何 定 
义 的 。 


7.4 ”执行 流程 


我 们 前 面 列 举 了 不 少 函数 的 示例 ， 不 过 对 于 函数 的 执行 流程 还 需要 进一步 了 解 ， 以 便 在 后 续 
章节 中 学 习 得 更 轻松 。 
为 了 保证 函数 的 定义 先 于 首次 调用 执行 ， 我 们 需要 知道 语句 的 执行 顺序 ， 即 执行 流程 。 
， 程序 执行 总 是 从 第 一 行 代码 开始 的 ， 从 上 到 下 、 从 左 到 右 ， 按 顺序 依次 执行 第 一 条 语句 。 
函数 定义 并 不 会 改变 程序 的 执行 流程 ， 不 过 函数 代码 块 中 的 语句 并 不 是 立即 执行 ， 而 是 等 函 
数 被 程序 调用 时 才 执行 。 
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函数 调用 可 以 看 作 程 序 执行 流程 中 的 一 个 迁 回路 径 ， 遇 到 函数 调用 时 ， 并 不 会 直接 继续 执行 
下 一 条 语句 ， 而 是 跳 到 函数 体 的 第 一 行 ， 继 续 执行 完 函 数 代码 块 中 的 所 有 语句 ， 再 跳 回 原来 离开 的 
地 方 。 

这 样 看 似 比 较 简单 ， 但 是 会 发 现 函 数 代码 块 中 可 以 调用 其 他 函数 ， 当 程序 流程 运行 到 一 个 函 
数 时 ， 可 能 需要 执行 其 他 函数 中 的 语句 。 但 当 执行 这 个 函数 的 语句 时 ， 又 可 能 需要 调用 执行 另 一 个 
函数 的 语句 。 

幸好 Python 对 于 程序 运行 到 哪里 有 很 好 的 记录 ， 所 以 在 每 个 函数 执行 结束 后 ， 程 序 都 能 跳 EE 
它 离开 的 地 方 ， 直 到 执行 到 整个 程序 的 结尾 才 会 结束 。 

当 我 们 看 别人 的 Python 代码 时 ， 不 一 定 要 一 行 一 行 按照 书写 顺序 阅读 ， 有 时 按照 执行 的 流程 
阅读 可 以 更 好 地 理解 代码 的 含义 。 

















7.5 ” 形 参 和 实 参 


我 们 前 面 已 经 讲述 过 函数 的 参数 ， 本 节 将 给 大 家 介绍 Python 函数 的 两 种 类 型 的 参数 ， 一 种 是 
函数 定义 里 的 形 参 ， 一 种 是 调用 函数 时 传 入 的 实 参 。 

经 常 在 使 用 一 些 内 置 函数 时 需要 传 入 参数 ， 如 调用 math.sin 时 ， 需 要 传 入 一 个 整 型 数字 作为 
实 参 。 有 的 函数 需要 多 个 参数 ， 如 math.pow 需要 两 个 参数 ， 一 个 是 基数 (base) ， 另 一 个 是 指数 
(exponent) 。 

在 函数 内 部 ， 会 将 实 参 的 值 赋 给 形 参 ， 例 如 (basic_info.py》: 

#! /usr/bin/python3 


# -*- coding:UTF-8 -*— 


def basic infol(age,name): 
print (f' 年 龄 ，{age}') 
Print (f' 名 称 : {name}') 
return 
在 该 函数 中 , 函数 名 basic_info 后 面 的 参数 列表 age 和 name 就 是 实 参 , 在 函数 体 中 分 别 将 age 
和 name 的 值 传 递 给 age 和 name， 函 数 体 中 的 age 和 name 就 是 形 参 。 





在 函数 体内 都 是 对 形 参 进行 操作 ， 不 能 操作 实 参 ， 即 对 实 参 做 出 更 改 。 





内 置 函数 的 组 合 规则 在 自 定义 函数 上 同样 适用 。 例 如, 我 们 对 自 定义 的 basic_info 函数 可 以 使 
用 任何 表达 式 作为 实 参 : 

basic_info(21， "小 萌 "*2) 

执行 结果 如 下 : 


年 龄 : 21 
名 称 : 小 萌 小 荫 
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由 执行 结果 看 到 ， 可 以 用 字符 串 的 乘法 表达 式 作为 实 参 。 
在 Python 中 ， 作 为 实 参 的 表达 式 会 在 函数 调用 前 执行 。 例 如 ， 在 上 面 的 示例 中 ， 实 际 上 先 执 
行 ' 小 萌 *2 的 操作 ， 将 执行 的 结果 作为 一 个 实 参 传递 到 函数 体 中 。 


作为 实 参 传 入 函数 的 变量 名 称 和 函数 定义 里 形 参 的 名 字 没 有 关系 。 函 数 只 关心 形 参 的 值 ， 
而 不 关心 它 在 调用 前 叫 什么 名 字 。 





7.6 变量 作用 域 


简单 来 说 ， 作 用 域 就 是 一 个 变量 的 命名 空间 。 在 Python 中 ， 程 序 的 变量 并 不 是 在 任何 位 置 都 
可 以 访问 的 , 访问 权限 决定 于 这 个 变量 是 在 哪里 赋值 的 , 代码 中 变量 被 赋值 的 位 置 决定 哪些 范围 的 
对 象 可 以 访问 这 个 变量 ， 这 个 范围 就 是 命名 空间 。 

变量 的 作用 域 决 定 哪 一 部 分 程序 可 以 访问 特定 的 变量 名 称 。Python 中 有 两 种 基本 的 变量 作用 
域 : 局 部 变量 和 全 局 变量 。 

下 面 我 们 分 别 对 两 种 作用 域 的 变量 进行 介绍 。 


7.6.1 局 部 变量 


在 函数 内 定义 的 变量 名 只 能 被 函数 内 部 引用 ， 不 能 在 函数 外 引用 ， 这 个 变量 的 作用 域 是 局 部 
也 称 为 局 部 变量 。 

定义 的 变量 如 果 是 在 函数 体 中 第 一 次 出 现 ， 就 是 局 部 变量 ， 例 如 (local_var.py)》: 

#! /usr/bin/python3 

# -*- coding:UTF-8 -*- 


的 


def local var(): 
x = 100 
print (x) 


在 local_var 函数 中 ，x 是 在 函数 体 中 被 定义 的 ， 并 且 是 第 一 次 出 现 ， 所 以 x 是 局 部 变量 。 
局 部 变量 只 能 在 函数 体 中 被 访问 ， 超 出 函数 体 的 范围 访问 就 会 报错 ， 例 如 〈local_func.py) : 
#! /usr/bin/python3 


# -*- coding:UTF-8 -+ 一 


def local func(): 
x=100 
print (f' 变 量 x: {x}') 
print (f' 函数 体外 访问 变量 x: {x}') 


local_func() 


函数 执行 结果 如 下 : 





Traceback (most recent call last) : 
File "D:/python/workspace/functiondef.py", line 7, in <module> 
Print (' 函数 体外 访问 变量 x: ss' % (x)) 

NameError: name 'x' is not defined 

执行 结果 告诉 我 们 ， 第 7 行 的 x 没有 定义 ， 由 输入 代码 可 知 ， 第 7 行 语句 没有 在 函数 体 中 ， 
因而 执行 时 报错 了 。 

如 果 把 x 作为 实 参 传 入 函数 体 中 ， 在 函数 体 中 不 定义 变量 x，x 会 被 认为 是 怎样 的 变量 呢 ? 定 
义 如 下 函数 并 执行 (func_var.py) : 


#! /usr/bin/python3 
# =*= coding:UTF-8 -*— 


def func var(x): 
print (f' 局 部 变量 x 为 :{x}') 

func_var (10) 

函数 执行 结果 如 下 : 

局 部 变量 x 为 :10 

由 执行 结果 看 到 ， 输 出 了 局 部 变量 的 值 。 这 里 有 一 个 疑问 ， 在 函数 体 中 没有 定义 局 部 变量 ，x 
只 是 作为 一 个 实 参 传 入 函数 体 中 , 怎么 变 成 局 部 变量 了 呢 ? 这 是 因为 参数 的 工作 原理 类 似 于 局 部 变 
量 ， 一 旦 进入 函数 体 ， 就 成 为 局 部 变量 了 。 

如 果 在 函数 外 定义 了 变量 x 并 赋值 ， 在 函数 体 中 能 和 否 使 用 x 呢 ? 定义 如 下 函数 并 执行 
(func eq.py) : 





#! /usr/bin/python3 
# -*- coding:UTF-8 -*- 


x=50 
def func eq() : 

print (f'x 等 于 : {x}') 
func_eq() 


执行 结果 如 下 : 
x 等 于 :50 


由 执行 结果 看 到 ， 在 函数 体 中 可 以 直接 使 用 函数 体外 的 变量 (全 局 变量 ， 在 7.6.2 小 节 介绍 ) 。 
如 果 在 函数 外 定义 了 变量 x 并 赋值 ， 将 x 作为 函数 的 实 参 ， 在 函数 体 中 更 改 x 的 值 ， 函 数 体 
外 x 的 值 是 否 跟 着 变更 呢 ? 定义 如 下 函数 并 执行 (func_outerpy) : 


#! /usr/bin/python3 
# =*= coding:UTF-8 一 * 一 


x=50 
def func outer (x): 
Print (f'x 等 于 : {x}') 
X=2 
print (f' 局 部 变量 x 变 为 : {x}') 
func outer (x) 
Print (f'x 一 直 是 : {x}') 
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执行 结果 如 下 : 

x 等 于 :50 

局 部 变量 x 变 为 :2 

x 一 直 是 :50 

由 输出 结果 看 到 , 在 函数 
函数 时 创建 了 新 的 命名 空间 





体 中 更 改变 量 的 值 并 不 会 更 改 函 数 体外 变量 的 值 。 这 是 因为 调用 fonc 
它 作 用 于 func 函数 的 代码 块 。 赋 值 语句 x=2 只 在 函数 体 的 作用 域内 


起 作用 ， 不 能 影响 外 部 作用 域 中 的 x。 可 以 看 到 ， 函 数 外 部 调用 x 时 ， 它 的 值 并 没有 改变 。 


7.6.2 ”全 局 变量 


在 函数 外 ， 一 段 代码 最 开始 赋值 的 变量 可 以 被 多 个 函数 引用 ， 这 就 是 全 局 变量 。 全 局 变量 可 


以 在 整个 程序 范围 内 访问 。 


我 们 在 前 面 已 经 使 用 过 全 局 变量 , 7.6.1 小 节 中 的 x=50 就 是 全 局 变量 。 下 面 看 一 个 全 局 变量 的 


示例 (global_var.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 一 * 一 


total val = 0 # 这 是 一 个 全 局 变量 


def sum numl(argl, arg2): 


total val = argl + arg2 # total val 在 这 里 是 局 部 变量 
Print (f" 函 数 内 是 局 部 变量 : {total_val}") 


return total val 


def total print(): 
print (f'total 的 值 是 : { 
return total val 


total val}') 


print (f' 函数 求 和 结果 : {sum_num (10，20)}') 


total print() 


print (f" 函 数 外 是 全 局 变量 : {total_val}") 


执行 结果 如 下 : 


函数 内 是 局 部 变量 :30 
函数 求 和 结果 : 30 
total 的 值 是 :0 
函数 外 是 全 局 变量 :0 


由 执行 结果 看 到 ， 全 局 变量 可 在 全 局 使 用 ， 在 函数 体 中 更 改 全 局 变量 的 值 不 会 影响 全 局 变量 


在 其 他 函数 或 语句 中 的 使 用 。 





我 们 再 看 一 个 函数 定义 六 


#! /usr/bin/python3 
ng 


num = 100 
def func global() : 
num = 200 





F 执 行 的 示例 (func_global.py): 


print (f' 函数 体 中 num 的 值 为 : {num} ') 





func global () 

print (f' 函数 外 num 的 值 为 : {num}"',) 

函数 执行 结果 为 : 

函数 体 中 num 的 值 为 :200 

函数 外 num 的 值 为 :100 

由 输出 结果 看 到 ， 我 们 定义 了 一 个 名 为 num 的 全 局 变量 ， 在 函数 体 中 也 定义 了 一 个 名 为 num 
的 全 局 变量 ， 在 函数 体 中 使 用 的 是 函数 体 中 的 num 变量 ， 在 函数 体外 使 用 num 变量 时 使 用 的 是 全 
局 变量 的 值 。 

由 此 我 们 得 知 : 函数 中 使 用 某 个 变量 时 ， 如 果 该 变量 名 既 有 全 局 变量 又 有 局 部 变量 ， 就 默认 
使 用 局 部 变量 。 

要 将 全 局 变量 变 为 局 部 变量 ， 只 需 在 函数 体 中 定义 一 个 和 局 部 变量 名 称 一 样 的 变量 即 可 。 能 
否 将 函数 体 中 的 局 部 变量 变 为 全 局 变量 呢 ? 定 义 如 下 函数 并 执行 (func_glo_1.py): 

#! /usr/bin/python3 


# =*= Coding:UTF-8 -=*— 


num = 100 
print (f' 函数 调用 前 num 的 值 为 : {num} ') 
def func glo_1(): 

global num 

num = 200 


print (f' 函数 体 中 num 的 值 为 : {num} ' ) 


func glo 1() 
print (f£' 函数 调用 结束 后 num 的 值 为 : {num}') 
函数 执行 结果 如 下 : 


函数 调用 前 num 的 值 为 :100 
函数 体 中 num 的 值 为 :200 
函数 调用 结束 后 num 的 值 为 :200 


由 函数 定义 及 执行 结果 看 到 ， 在 函数 体 中 的 变量 num 前 加 了 一 个 global 关键 字 后 ， 函 数 调用 
结束 后 ， 在 函数 外 使 用 num 变量 时 ， 值 变 为 和 函数 体 中 的 值 一样 了 。 

由 此 我 们 得 知 : 要 在 函数 中 将 某 个 变量 定义 为 全 局 变量 ， 在 需要 被 定义 的 变量 前 加 一 个 关键 
字 global 即 可 。 

在 函数 体 中 定义 global 变量 后 ， 在 函数 体 中 对 变量 做 的 其 他 操作 也 是 全 局 性 的 。 定 义 如 下 函 
数 并 执行 (func_glo_ 2.py) : 

#! /usr/bin/python3 


# -*— coding:UTF-8 一 * 一 


num = 100 
print (f' 函数 调用 前 num 的 值 为 : {num} ') 
def func glo 2(): 

global num 

num = 200 

num += 100 

print (f' 函数 体 中 num 的 值 为 : {num} ') 
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func glo 2() 
print (f' 函数 调用 结束 后 num 的 值 为 : {num}') 


函数 执行 结果 如 下 : 


函数 调用 前 num 的 值 为 :100 
函数 体 中 num 的 值 为 :300 
函数 调用 结束 后 num 的 值 为 : 300 


由 执行 结果 看 到 ， 在 函数 体 中 对 定义 的 全 局 变量 num 做 了 一 次 加 100 的 操作 ，num 的 值 由 原 


来 的 200 变 为 300， 在 函数 体外 获得 的 num 的 值 也 变 为 300 了 。 


7.7 “有 返回 值 和 无 返回 值 函 数 


前 面 在 定义 函数 时 ， 有 些 函 数 使 用 了 return 语句 ， 有 些 函数 没有 使 用 retum 语句 ， 使 用 return 


语句 与 不 使 用 retum 语句 有 什么 区 别 呢 ? 








由 7.2 节 我 们 知道 ， 若 定义 函数 时 没有 使 用 return 语句 ， 则 默认 返回 一 个 None。 要 返 区 











一 个 


None， 可 以 只 写 一 个 return， 但 要 返回 具体 的 数值 ， 就 需要 在 return 后 面 加 上 需要 返回 的 内 容 。 对 

于 函数 的 定义 来 说 , 使 用 retum 语句 可 以 向 外 提供 该 函数 执行 的 一 些 结果 ; 对 于 函数 的 调用 者 来 说 ， 

是 否 可 以 使 用 函数 中 执行 的 一 些 操作 结果 ， 就 在 于 函数 是 否 使 用 retum 语句 返回 了 对 应 的 执行 结果 。 
在 Python 中 , 有 的 函数 会 产生 结果 〈 如 数学 函数 )， 我 们 称 这 种 函数 为 有 返回 值 函数 (fruitful 








function》; 有 的 函数 执行 一 些 动作 后 不 返回 任何 值 ， 我 们 称 这 类 函数 为 无 返回 值 函 数 。 











当 我 们 调用 有 返回 值 函 数 时 ， 可 以 使 用 返回 的 结果 做 相关 操作 ; 当 我 们 使 用 无 返回 值 或 返回 


None 的 函数 时 ， 只 能 得 到 一 个 None 值 。 
比如 定义 如 下 函数 并 执行 (func_transferpy) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 一 * 一 





def no return(): 
print ('no return 函数 不 写 return 语句 ') 


def just_return(): 
print ('just return 函数 只 写 return， 不 返回 具体 内 容 ') 


return 


def return val(): 
x=10 
y=20 
z=x+y 
Print ('return val 函数 写 return 语句 ， 并 返回 求 和 的 结果 。') 


return z 


print (f' 函 数 no return 调用 结果 : {no_return()}') 
print (f' 函 数 just return 调用 结果 : {just_return()}') 
print (f' 函 数 return val 调用 结果 : {return val()}') 





函数 执行 结果 如 下 : 


no return 函数 不 写 return 语句 

函数 no return 调用 结果 : None 

just return 函数 只 写 return， 不 返回 具体 内 容 
函数 just return 调用 结果 : ”None 

return val 函数 写 return 语句 ， 并 返回 求 和 的 结果 。 
函数 return val 调用 结果 : ”30 


由 执行 结果 看 到 ， 定 义 函 数 时 不 写 retum 或 内 写 一 个 return 语句 返回 的 都 是 None。 如 果 写 了 
返回 具体 内 容 ， 调 用 函数 时 就 可 以 获取 具体 内 容 。 


7.8 ”为 什么 要 有 函数 





随 着 函数 学 习 的 不 断 深入 ， 不 知 你 是 否 有 这 样 的 疑问 ， 为 什么 要 有 函数 ， 定 义 函 数 的 好 处 在 
哪里 ? 

我 们 前 儿童 都 是 在 交互 模式 下 编码 的 ， 代 码 量 不 大 ， 操 作 也 不 复杂 ， 在 交互 模式 下 操作 没 什 
么 问题 ， 唯 一 一 点 就 是 不 能 保存 操作 记录 。 随 着 代码 量 越 来 越 大 ， 在 交互 模式 下 操作 就 不 方便 了 ， 
后 面 我 们 引入 了 在 文本 中 编辑 程序 ， 在 cmd 命令 下 执行 的 方式 。 

使 用 文本 结合 cmd 命令 的 方式 可 以 帮助 我 们 记录 历史 记录 ， 并 能 更 简洁 地 进行 代码 的 编辑 。 
不 过 在 第 6 章 的 学 习 中 我 们 体会 到 , 代码 行 数 达到 一 定量 时 , 把 所 有 代码 都 放 在 一 起 的 方式 写 起 来 
和 看 起 来 都 有 一 些 难度 。 

引入 函数 后 ， 在 编写 代码 的 过 程 中 ， 可 以 将 一 些 实现 写成 对 应 的 函数 ， 通 过 调用 函数 做 后 续 
操作 ， 并 且 可 以 重复 调用 ， 使 得 代码 更 简洁 、 易 读 ， 一 些 代码 也 可 以 重复 使 用 。 

对 函数 的 好 处 概括 如 下 : 

(1) 新 建 一 个 函数 ， 让 我 们 有 机 会 为 一 组 语句 命名 ， 成 为 一 个 代码 块 ， 这 样 更 有 利于 阅读 代 
码 ， 并 且 组 织 后 的 代码 更 容易 调试 。 

(2) 函数 方法 可 以 减少 重复 代码 的 使 用 ， 让 程序 代码 总 行 数 更 少 ， 之 后 修改 代码 时 只 需要 少 
量 修改 就 可 以 了 。 

(3) 将 一 个 很 长 的 代码 片段 拆 分 成 几 个 函数 后 ， 可 以 对 每 一 个 函数 进行 单独 调试 ， 单 个 函数 
调试 通过 后 ， 再 将 它们 组 合 起 来 形成 一 个 完整 的 产品 。 

(4) 一 个 设计 良好 的 函数 可 以 在 很 多 程序 中 复 用 ， 不 需要 重复 编写 。 


7.9 返回 函数 


我 们 前 面 讲解 了 函数 可 以 有 返回 值 ， 除 了 返回 值 外 ， 函 数 中 是 否 可 以 返回 函数 呢 ? 
例如 ， 函 数 定义 如 下 〈calc_sum.py) : 


#! /usr/bin/python3 
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# -*- coding:UTF-8 —*— 


def calc_sum(*args) : 
ax = 0 
for n in args: 
ax = ax + 了 
return ax 


这 里 定义 了 一 个 可 变 参 数 的 求 和 函数 ， 该 函数 允许 传 入 多 个 参数 ， 最 后 返回 求 得 的 和 。 如 果 
不 需要 立刻 求 和 ， 而 是 在 后 面 的 代码 中 根据 需要 再 计算 ， 怎 么 办 呢 ? 例如 ， 函 数 定义 如 下 
(sum late.py) : 





#! /usr/bin/python3 
# -*- coding:UTF-8 -*— 


def sum late(*args): 
def calc sum(): 
ax=0 
for n in args: 
ax =ax+n 
return ax 
return calc_sum 


可 以 看 到 ， 此 处 返回 了 一 个 我 们 之 前 没有 看 过 的 类 型 的 值 ， 是 返回 了 一 个 函数 吗 ? 是 的 ， 此 
处 确实 返回 了 一 个 函数 。 对 于 此 处 定义 的 函数 ， 我 们 没有 返回 求 和 的 结果 ， 而 是 返回 了 一 个 求 和 函数 。 

操作 执行 函数 : 

print (f' 调 用 sum_late 的 结果 : {sum late(1, 2, 3, 4)}') 


calc_sum=sum late(1l, 2, 3, 4) 
print (f' 调 用 calc_sum 的 结果 : {calc_sum()}') 


得 到 函数 的 执行 结果 如 下 : 


调用 sum_late 的 结果 : <function sum late.<locals>.calc_ sum at 0x000000000077DE18> 
调用 calc_sum 的 结果 : 10 


由 执行 结果 看 到 ， 调 用 定义 的 函数 时 没有 直接 返回 求 和 结果 ， 而 是 返回 了 一 串 字符 (这 个 字 
符 其 实 就 是 函数 ) 。 当 执行 返回 的 函数 时 ， 才 真正 计算 求 和 的 结果 。 

在 这 个 例子 中 ， 在 函数 sum_late 中 又 定义 了 函数 calc_sum， 并 且 内 部 函数 calc_sum 可 以 引用 
外 部 函数 sum_late 的 参数 和 局 部 变量 。 当 sum_late 返回 函数 calc_sum 时 ， 相 关 参 数 和 变量 都 保存 
在 返回 的 函数 中 ， 称 为 闭 包 〈Closure) 。 这 种 程序 结构 威力 极 大 。 

有 一 点 需要 注意 ， 当 调用 sum_late() 函 数 时 ， 每 次 调用 都 会 返回 一 个 新 的 函数 ， 即 使 传 入 相同 
的 参数 也 是 如 此 ， 例 如 : 


fl=sum late (1,2,3) 
f2=sum late (1,2,3) 
print ('f1==f2 的 结果 为 :', f1==f2) 


执行 结果 如 下 : 
£1==f2 的 结果 为 : False 
由 执行 结果 看 到 ， 返 回 的 函数 fl 和 了 介 不同 。 




















我 们 在 此 处 提 到 了 闭 包 ， 什 么 是 闭 包 呢 ? 


闭 包 的 定义 : 如 果 在 一 个 内 部 函数 中 对 外 部 函数 〈 不 是 在 全 局 作用 域 ) 的 变量 进行 引用 ， 内 


部 函数 就 被 认为 是 闭 包 。 





在 上 面 的 示例 中 ， 返 回 的 函数 在 定义 内 部 引用 了 局 部 变量 args， 当 函数 返回 一 个 函数 后 ， 内 


部 的 局 部 变量 会 被 新 函数 引用 。 
我 们 定义 一 个 函数 (func_countpy) : 


#! /usr/bin/python3 
关 -~*- coding:UTF-8 -*— 


def func count(): 
fs = [] 
for i in range(l, 4): 
def f£(): 
return i*i 
fs.append (f) 
return fs 


£1, f2, £3 = func count() 





该 示例 中 ， 每 次 循环 都 会 创建 一 个 新 函数 ， 最 后 把 创建 的 3 个 函数 都 返回 了 。 执 行 该 函数 得 


到 的 结果 是 怎样 的 呢 ? 调用 如 0、f20 和 他 0) 的 结果 是 1、4、9 吗 ? 
我 们 如 下 执行 函数 : 
print (f'fl 的 结果 是 : {f1()}') 


print (f' f2 的 结果 是 : {f2 ()}') 
print (f'f3 的 结果 是 : {f3()] 7") 


执行 结果 如 下 : 


£1 的 结果 是 : 9 
£2 的 结果 是 : 9 
f3 的 结果 是 : 9 
由 执行 结果 看 到 ，3 个 函数 返回 的 结果 都 是 9， 怎么 全 是 9 呢 ? 


原因 在 于 返 








回 的 函数 引用 了 变量 i， 但 它 并 非 立刻 执行 。 等 到 3 个 函数 都 返回 


的 变量 i 已 经 变 成 了 3， 因 此 最 终结 果 为 9。 





时 ， 它 们 所 引用 


返回 闭 包 时 ， 返 回 函 数 不 要 引用 任何 循环 变量 或 后 续 会 发 生变 化 的 变量 ， 否 则 很 容易 出 现 
你 意 想不到 的 问题 。 





如 果 一 定 要 
我 们 定义 如 


引用 循环 变量 ， 该 怎么 办 呢 ? 
下 函数 并 执行 Cfunc_count up.py) : 





#! /usr/bin/python3 
# -*- coding:UTF-8 一 * 一 


def func_count_up() : 


def £(j) 
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def g() : 
return j*j 
return g 
fs = [] 
for i in range(1，4): 


fs.append(f(i)) # 工 ( 革 ) 立 刻 被 执行 ， 因 此 :i 的 当前 值 被 传 入 王 () 


return fs 


fl1，f2，f3 = func count up() 
print (f'fl 的 结果 是 : {£1 ()}') 
print (f' f2 的 结果 是 : {f2 ()} 7) 
print (f'f3 的 结果 是 : {f3 ()} 7) 


函数 执行 结果 如 下 : 


fl 的 结果 是 : 1 

£2 的 结果 是 : 4 

£3 的 结果 是 : 9 

由 执行 结果 看 到 ， 这 次 输出 结果 和 我 们 预期 的 一 致 。 此 处 的 代码 看 起 来 有 点 费力 ， 大 家 可 以 
想 想 其 他 更 好 的 办 法 。 


7.10 ”递归 函数 


我 们 前 面 学 习 了 在 函数 中 返回 函数 ， 也 学 习 了 在 一 个 函数 中 调用 另 一 个 函数 ， 函 数 是 否 可 以 
调用 自己 呢 ? 答案 是 可 以 的 。 如 果 一 个 函数 在 内 部 调用 自身 ， 这 个 函数 就 称 作 递归 函数 。 

递归 函数 的 简单 定义 如 下 : 

def recurision() : 

return recursion() 

这 只 是 一 个 简单 定义 ， 什 么 也 做 不 了 。 

当然 ， 你 可 以 尝试 会 发 生 什么 结果 。 理 论 上 会 永远 运行 下 去 ， 但 实际 操作 时 可 能 不 一 会 儿 程 
序 就 崩溃 了 【发 生 异 常 ) 。 因 为 每 次 调用 函数 都 会 用 掉 一 点 内 存 ， 在 足够 多 的 函数 调用 发 生 后 ， 空 
间 几 乎 被 占 满 ， 程 序 就 会 报 异常 。 

这 类 递归 被 称 作 无 穷 递归 (infinite recursion) ， 理 论 上 永远 不 会 结束 。 当 然 ， 我 们 需要 能 实际 
做 事情 的 函数 ， 有 用 的 递归 函数 应 该 满足 如 下 条 件 : 

(1) 当 函 数 直接 返回 值 时 有 基本 实例 〈 最 小 可 能 性 问题 ) 。 

(2) 递归 实例 ， 包 括 一 个 或 多 个 问题 最 小 部 分 的 递归 调用 。 

使 用 递归 关键 在 于 将 问题 分 解 为 小 部 分 ， 递 归 不 能 永远 继续 下 去 ， 因 为 它 总 是 以 最 小 可 能 性 
问题 结束 ， 而 这 些 问 题 又 存储 在 基本 实例 中 。 

函数 调用 自身 怎么 实现 呢 ? 

其 实 函 数 每 次 被 调用 时 都 会 创建 一 个 新 命名 空间 ， 也 就 是 当 函 数 调用 “自身 ”时 ， 实 际 上 运 
行 的 是 两 个 不 同 的 函数 〈 也 可 以 说 一 个 函数 具有 两 个 不 同 的 命名 空间 ) 。 

我 们 来 看 一 个 递归 示例 ， 计 算 阶 乘 m! = 1X2X3X.…Xn， 用 函数 得 ct(n) 表 示 ， 可 以 看 出 : 
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实现 的 。 每 当 进 入 一 个 函数 调用 ， 栈 就 会 加 一 层 栈 帧 ， 每 当 函 数 返回 
的 大 小 不 是 无 限 的 ， 因此 递归 调用 的 次 数 过 多 会 导致 栈 溢 出 。 可 以 试 试 fact(1000), 执行 结果 如 下 


fact(n)=n!=1X2X3X...X(n-1)Xn=(n-l)! Xn=fact(n-1)xn 
所 以 ，fact(n) 可 以 表示 为 nXfact(n-1)， 只 有 n=1 时 需要 特殊 处 理 。 
于 是 ，fact(n) 用 递归 方式 定义 函数 如 下 〈factpy) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 =* 一 





def fact(n) : 
if n=l: 
return 1 
return n * fact(n - 1) 


执行 该 函数 : 

print (£' 调 用 递归 函数 执行 结果 为 :， {fact (5) }') 

执行 结果 如 下 : 

调用 递归 函数 执行 结果 为 。 120 

由 执行 结果 看 到 ， 函 数 己 正确 输出 5 的 阶乘 的 结果 。 
计算 fact(5) 时 可 以 根据 函数 定义 看 到 计算 过 程 : 


===> fact(5) 


===> 5 * fact(4) 

===> 5 * (4 * fact(3)) 

===> 5 * (4* (3 * fact(2))) 

mee> 5* (4* (3* (2* fact(1)))) 
===> 5* (4* (3* (2 * 1))) 

===> 5* (4* (3* 2)) 

===> 5* (4* 6) 

===> 5 * 24 

===> 120 


由 函数 定义 可 以 得 知 ， 递 归 函 数 的 优点 是 定义 简单 、 逻 辑 清晰 。 
理论 上 ， 所 有 递归 函数 都 可 以 写成 循环 的 方式 ， 不 过 循环 的 逻辑 不 如 递归 清晰 。 


使 用 递归 函数 需要 注意 防止 栈 溢出 。 在 计算 机 中 ， 函 数 调用 是 通过 栈 〈stack) 这 种 数据 结构 





Traceback (most recent call last) : 
File "D:/python/workspace/functiondef.py"，1line 271, in <module> 
print ("调用 递归 函数 执行 结果 为 :', fact (1000) ) 
File "D:/python/workspace/functiondef.py", line 269, in fact 
return n * fact(n - 1) 
File "D:/python/workspace/functiondef.py", line 269, in fact 
return n * fact(n - 1) 


File "D:/python/workspace/functiondef.py", line 267, in fact 
if n==1: 
RecursionError: maximum recursion depth exceeded in comparison 


由 执行 结果 看 到 ， 执 行 出 现 异 常 ， 异 常 提示 超过 最 大 递归 深度 。 


， 栈 就 会 减 一 层 栈 帧 。 由 于 栈 
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这 个 问题 怎么 解决 呢 ? 

解决 递归 调用 栈 溢出 的 方法 是 通过 尾 递归 优化 ， 事 实 上 尾 递归 和 循环 的 效果 一 样 ， 把 循环 看 
成 一 种 特殊 尾 递归 函数 也 可 以 。 

尾 递归 是 指 在 函数 返回 时 调用 函数 本 身 ， 并 且 retum 语句 不 能 包含 表达 式 。 这 样 ， 编 译 器 或 解 
释 器 就 可 以 对 尾 递归 进行 优化 ,使 递归 本 身 无 论调 用 多 少 次 都 只 占用 一 个 栈 帧 , 从 而 避免 栈 溢出 的 
情况 。 

由 于 上 面 的 fact(n) 函 数 retum n * fact(n - 1) 引 入 了 乘法 表达 式 ， 因 此 不 是 尾 递归 。 要 改 成 尾 递 
归 方式 需 要 多 一 点 代码 , 主要 是 把 每 一 步 乘积 传 入 递归 函数 中 , 看 如 下 函数 定义 方式 (fact_iter.py): 


#! /usr/bin/python3 
# =*- coding:UTF-8 —*— 








def fact(n): 
return fact iter(n, 1) 


def fact iter(num, product): 
if num == 1: 
return product 
return fact iter(num - 1, num * Product) 
可 以 看 到 , return fact_iter(num - 1, num * product) 仅 返回 递归 函数 本 身 ,num - 1 和 num * product 
在 函数 调用 前 就 会 被 计算 ， 不 影响 函数 调用 。 
fact(5) 对 应 的 fact_iter(5, 1) 的 调用 如 下 : 
===> fact iter(5, 1) 
===> fact iter(4, 5) 
===> fact_ iter(3, 20) 
===> fact iter(2, 60) 
===> fact iter(1, 120) 
===> 120 
由 操作 结果 看 到 ， 调 用 尾 递归 时 如 果 做 了 优化 ， 栈 就 不 会 增长 。 但 是 尾 递归 函数 一 般 只 能 递 
归 fact(997)， 递 归 深度 超过 997 后 ， 一 般 会 报 如 下 错误 : 


RecursionError: maximum recursion depth exceeded in comparison 


要 能 测试 fact(1000)， 需 要 加 入 如 下 设置 : 
import sys 
sys.setrecursionlimit (10000) # 例 如 这 里 设置 深度 为 10000 


7.11 匿名 函数 


什么 是 匿名 函数 呢 ? 

匿名 函数 就 是 不 再 使 用 def 语句 这 样 的 标准 形式 定义 一 个 函数 。 

Python 使 用 lambda 创建 匿名 函数 。 

lambda 只 是 一 个 表达 式 ， 函 数 体 比 def 简单 很 多 。 

lambda 的 主体 是 一 个 表达 式 ， 而 不 是 一 个 代码 块 ， 仅 能 在 lambda 表达 式 中 封装 有 限 的 逻辑 。 
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lambda 函数 拥有 自己 的 命名 空间 ， 不 能 访问 自 有 参数 列表 之 外 或 全 局 命名 空间 的 参数 。 
lambda 函数 的 语法 只 包含 一 个 语句 ， 语 句 如 下 : 
lambda [argl [,arg2,.....argn]]:expression 
匿名 函数 应 该 如 何 应 用 呢 ? 
先 看 一 个 求 两 个 数 的 和 的 示例 。 
使 用 def 语句 : 


def func (xvy) : 
return x+yY 


使 用 lambda 表达 式 : 

lambda x,y: x+y 

由 上 面 的 代码 可 以 看 到 ， 使 用 lambda 表达 式 编写 的 代码 比 使 用 def 语句 少 。 这 里 不 太 明 显 ， 
再 看 一 个 代码 更 多 的 示例 。 

比如 求 一 个 列表 中 大 于 3 的 元 素 。 

通过 过 程式 编程 实现 ， 也 是 常规 的 方法 。 在 交互 模式 下 输入 如 下 : 


>>> L1=[1,2,3,4,5] 
>>> L2=[] 
>>> for i in L1: 
if i>3: 
L2.append (i) 


>>> print(' 列 表 中 大 于 3 的 元 素 有 : ',L2) 
列表 中 大 于 3 的 元 素 有 : [4，5] 


通过 函数 式 编程 实现 ， 运 用 filter， 给 出 一 个 判断 条 件 (func_filter.py》: 


def func filter(x): 
return x>3 
£_list=filter (func filter, [1,2,3,4,5]) 
Print (' 列 表 中 大 于 3 的 元 素 有 : '， [item for item in f list]) 


执行 结果 如 下 : 

列表 中 大 于 3 的 元 素 有 : [4，5] 

如 果 运 用 匿名 函数 ， 就 会 更 加 精简 ， 一 行 代码 即 可 : 

print (' 列 表 中 大 于 3 的 元 素 有 : '， [item for item in filter(lambda x:x>3, [1,2,3,4,5])]) 

执行 结果 如 下 : 

列表 中 大 于 3 的 元 素 有 : [4，5] 

从 上 面 的 操作 可 以 看 出 ，lambda 一 般 应 用 于 函数 式 编程 ， 代 码 简洁 ， 常 和 filter 等 函数 结合 使 用 。 
我 们 对 上 面 使 用 lambda 的 示例 进行 解析 。 

在 表达 式 中 : 

x 为 lambda 函数 的 一 个 参数 。 
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:为 分 割 符 。 
x>3 则 是 返回 值 ， 在 lambda 函数 中 不 能 有 return， 其 实 冒 号 〈:) 后 面 就 是 返回 值 。 


item for item in filter 是 Python 3 中 filter 函数 的 取 值 方式 ， 因 为 从 Python 3 起 ，filter 函数 返回 








的 对 象 从 列表 改 为 迭代 器 (filter object) 。filter object 支持 迭代 操作 ， 比 如 for 循环 : 


for item in a filter object: 
print (item) 


如 果 还 是 需要 一 个 列表 ， 就 可 以 这 样 得 到 它 

filter list = [item for item in a filter object] 

由 这 些 示 例 可 以 看 到 ， 匿 名 函数 确实 有 它 的 优点 。 

这 里 有 一 个 疑问 ， 在 什么 情况 下 使 用 匿名 函数 呢 ? 

一 般 以 下 情况 多 考虑 使 用 匿名 函数 : 

(1) 程序 一 次 性 使 用 、 不 需要 定义 函数 名 时 ， 用 匿名 函数 可 以 节省 内 存 中 定义 变量 所 占 的 空间 。 
(2) 如 果 想 让 程序 更 加 简洁 ， 使 用 匿名 函数 就 可 以 做 到 。 
当然 ， 上 匿名 函数 有 3 个 规则 要 记 住 : 

(1) 一 般 有 一 行 表达 式 ， 必 须 有 返回 值 。 

(2) 不 能 有 retum。 

(3) 可 以 没有 参数 ， 也 可 以 有 一 个 或 多 个 参数 。 

下 面 看 几 个 匿名 函数 的 示例 〈 在 交互 模式 下 输入 ) 。 

无 参 匿名 函数 : 

>>> t = lambda : True # 分 号 前 无 任何 参数 


>>> 七 () 
True 


带 参数 匿名 函数 : 


>>> lambda x: x**3 # 一 个 参数 
>>> lambda x,y,z:x+ty+z # 多 个 参数 
>>> lambda x,y=3: x*y # 人 允许 参数 存在 默认 值 


匿名 函数 调用 : 

>>> C = lambda x,y,2: x*y*z 

>>> c(2,3,4) 

24 

>>> c = lambda x,y=2: x+y # 使 用 了 默认 值 


>>> c (10) # 如 果 不 输入 ， 就 使 用 默认 值 2 
12 





学 意 


7.12 偏 函数 


偏 函数 是 从 Python 2.5 引入 的 概念 ， 通 过 functools 模块 被 用 户 调 用 。 注 意 这 里 的 偏 函数 和 数 
义 上 的 偏 函数 不 一 样 。 
偏 函数 是 将 所 要 承载 的 函数 作为 partial0) 函 数 的 第 一 个 参数 ， 原 函数 的 各 个 参数 依次 作为 


partial() 函 数 的 后 续 参数 ， 除 非 使 用 关键 字 参 数 。 


通过 语言 描述 可 能 无 法 理解 偏 函数 怎么 使 用 ， 下 面 举 一 个 常见 的 例子 说 明 。 在 这 个 例子 里 ， 


将 实现 一 个 取 余 函数 , 取得 整数 100 对 不 同 数 m 的 100%m 的 余数 。 编 写 代码 如 下 Cmod_partial.py ): 


示例 


也 称 
( 划 
最 后 





#! /usr/bin/python3 
# =*=- coding:UTF-8 -*= 


from functools import partial 


def mod partiall(n, m): 
returnn%m 


mod by _100 = partial (mod, 100) 

print (f' 自 定义 函数 ，100 对 7 取 余 结果 为 : {mod_partial (100,，7)}') 

print (f' 调 用 偏 函 数 ，100 对 7 取 余 结 果 为 : {mod_by_100(7)}') 

函数 执行 结果 为 : 

自 定义 函数 ，100 对 7 取 余 结果 为 : 2 

调用 偏 函数 ，100 对 7 取 余 结果 为 : 2 

由 执行 结果 看 到 ， 使 用 偏 函数 所 需 代 码 量 比 自 定义 函数 更 少 、 更 简洁 。 

在 介绍 函数 的 参数 时 ， 我 们 讲 到 通过 设 定 参数 的 默认 值 可 以 降低 函数 调用 的 难度 。 从 上 面 的 
来 看 ， 偏 函数 也 可 以 做 到 这 一 点 。 


7.13 ”牛刀 小 试 一 一 经典 排序 之 快速 排序 实现 


快速 排序 (quick sort) 是 一 种 分 治 排序 算法 。 该 算法 首先 选取 一 个 划分 元 素 (partition element， 
为 pivot) ; 然后 重 排列 表 ， 将 其 划分 为 3 部 分 ， 即 left (小 于 划分 元 素 pivot 的 部 分 ) 、pivot 
分 元 素 ) 、right (大 于 划分 元 素 pivot 的 部 分 )， 此 时 划分 元 素 pivot 已 经 在 列表 的 最 终 位 置 上 ; 
分 别 对 left 和 right 两 部 分 进行 递归 排序 。 

其 中 ， 划 分 元 素 的 选取 直接 影响 快速 排序 算法 的 效率 ， 通 常 选择 列表 的 第 一 个 元 素 、 中 间 元 
最 后 一 个 元 素 作为 划分 元 素 ， 当 然 也 有 更 复杂 的 选择 方式 。 划 分 过 程 根据 划分 元 素 重 排列 表 ， 


是 快速 排序 算法 的 关键 所 在 。 


速 排 


快速 排序 算法 的 优点 是 原 位 排序 (只 使 用 很 小 的 辅助 栈 ) ， 平 均 时 间 复 杂 度 为 O(n log n)。 人 快 
序 算法 的 缺点 是 不 稳定 ， 最 坏 情况 下 时 间 复 杂 度 为 O(n”)。 
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代码 实现 如 下 〈quick_ sortpy) : 


函数 调用 示例 : 


执行 结果 如 下 : 








7.14 调 试 


前 面 对 调试 的 介绍 都 是 基于 刻意 犯错 进行 的 ， 本 章 开始 介绍 一 些 调试 技巧 。 
将 一 个 大 程序 分 解 为 小 函数 ， 自 然 引入 了 调试 的 检查 点 。 如 果 一 个 函数 不 能 正常 工作 ， 可 以 
先 考 虑 以 下 3 点 : 


(1) 函数 获得 的 实 参 有 问题 ， 某 个 前 置 条 件 没有 达到 。 
(2) 函数 本 身 有 问题 ， 某 个 后 置 条 件 没有 达到 。 
(3) 函数 的 返回 值 有 问题 或 使 用 方式 不 对 。 


要 检查 第 一 个 问题 ， 可 以 在 函数 体 开始 处 加 上 print 语句 ， 显 示 实 参 的 值 或 类 型 ， 用 于 显示 检 
查 前 置 条 件 。 

如 果实 参 没有 问题 ， 就 在 每 个 retum 语句 前 添加 print 语句 ， 显 示 返 回 值 。 如 果 有 可 能 ， 手 动 
检查 返回 值 ， 使 用 更 容易 检查 结果 的 参数 调用 函数 。 

如 果 函 数 没有 问题 ， 就 检查 调用 代码 ， 确 保函 数 返 回 值 被 正确 使 用 。 

要 学 会 充分 使 用 print 语句 ， 该 语句 能 帮 我 们 清晰 了 解 函数 的 执行 流程 。 


7.15 ”问题 解答 


(1) len0、count0、sum0 三 个 计算 函数 有 什么 区 别 ? 


答 : len0 返回 对 象 的 长 度 。 比 如 len([1,2,3])， 返 回 值 为 3。 
count() 计算 包含 对 象 的 个 数 。 比 如 [1,1,1,2].count(1)， 返 回 值 为 3。 
sum() 进行 和 运算 。 比 如 sum([1,2,3])， 返 回 值 为 6。 


(2) 函数 在 项 目 中 使 用 得 多 吗 ? 

答 : 函数 在 项 目 中 使 用 得 非常 多 。 在 项 目 实战 中 ， 为 了 方便 团队 开发 和 代码 复 用 ， 我 们 所 写 
的 所 有 程序 几乎 都 需要 以 函数 的 方式 定义 。 一 旦 定义 了 一 个 函数 ， 其 他 Python 文件 就 可 以 通过 
import 的 方式 从 文件 中 导入 这 个 函数 直接 使 用 ， 从 而 实现 代码 的 复 用 。 

(3) 如 何 灵活 使 用 函数 ? 

答 : 函数 在 Python 中 是 一 个 很 重要 的 概念 ， 能 灵活 使 用 函数 对 我 们 帮助 很 大 。 要 灵活 使 用 函 
数 ， 首 先 要 能 灵活 编写 语句 ， 函 数 是 语句 的 集合 ,语句 写 得 灵活 了 ， 函 数 也 就 灵活 了 。 语 句 灵活 是 
指 写 出 的 语句 所 表达 的 意思 清晰 ， 不 但 单条 语句 意思 要 清晰 ,语句 之 间 的 关系 也 要 清晰 。 当 然 , 需 
要 实战 经 验 的 积累 和 方法 的 尝试 ， 才 能 逐渐 灵活 使 用 函数 。 
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7.16 温 故 知 新 ， 学 以 致 用 








本 章 主 要 讲解 了 函数 定义 、 函 数 参 数 、 变 量 作用 域 、 函 数 递 归 等 内 容 ， 在 本 章 结 束 前 回顾 一 
下 学 到 的 概念 。 

(1) 如 何 定义 函数 ? 

(2) 函数 有 哪些 参数 类 型 ? 

(3) 什么 是 形 参 和 实 参 ? 

(4) 变量 的 作用 域 有 哪些 ? 

(5) 怎么 使 用 递归 函数 ? 


思考 并 解决 如 下 问题 : 


(1) 自 定义 一 个 函数 ， 打 印 出 “hello，world! ”。 
pn 
(3) 定义 一 个 带 参 数 的 函数 ， 如 果 传 入 的 参数 为 数字 ， 则 做 加 减 操作 ， 否 则 直接 打印 出 对 应 





(4) 定义 一 个 带 默认 参数 的 函数 ， 打 印 出 默认 参数 值 。 

(5) -个 带 必须 参数 和 默认 参数 的 函数 ， 通 过 函数 调用 更 改 默认 参数 值 。 

(6) 定义 一 个 带 必须 参数 和 可 变 参 数 的 函数 ， 通 过 传递 不 同 的 可 变 参数 ， 使 函数 执行 不 同 操 
作 ， 比 如 做 数值 的 加 减 、 数 值 的 乘除 、 字 符 串 的 相关 操作 等 。 

(7) 定义 一 个 带 全 局 变量 的 函数 ， 并 对 全 局 变量 做 各 种 操作 ， 观 察 全 局 变量 变更 后 ， 各 全 局 
变量 引用 处 是 否 也 变更 。 

(8》 自己 设计 一 个 返回 函数 的 函数 ， 返 回 带 必须 参数 、 可 变 参数 、 默 认 参 数 等 的 函数 。 

(9) 利用 Python 内 置 的 hex(0) 函 数 把 一 个 整数 转换 成 十 六 进 制 表示 的 字符 串 。 

(10) 定义 一 个 函数 quadratic(a, b, c)， 接 收 3 个 参数 ， 返 回 一 元 二 次 方程 axz+ bx+c=0 的 
两 个 解 。 








计算 平方 根 可 以 调用 math.sqrt( 函 数 。 


(11) 给 你 一 个 包含 不 同 英文 字母 和 标点 符号 的 文本 ， 找 到 其 中 出 现 最 多 的 字母 ， 返 回 的 字 
母 必须 是 小 写 形式 ， 检 查 字 母 时 不 区 分 大 小 写 ， 如 在 搜索 中 "A" == "a"。 要 确保 不 计算 标点 符号 
数字 和 空格 ， 只 计算 字母 。 

如 果 找 到 两 个 或 两 个 以 上 具有 相同 频率 的 字母 ， 那 么 返回 先 出 现在 字母 表 中 的 字母 。 例 如 ， 
one 包含 o、n、e 每 个 字母 一 次 ， 因 此 我 们 选择 e。 
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第 8 章 
面向 对 象 编 程 


前 几 章 介绍 了 Python 主要 的 内 建 对 象 类 型 数字、 字符 串 、 列 表 、 元 组 和 字典 )》 和 自 定 义 函 
数 的 方式 。Python 还 支持 创建 自己 的 对 象 。 

Python 从 设计 之 初 就 是 一 门面 向 对 象 语言 ， 它 提供 一 些 语言 特性 支持 面向 对 象 编程 《Object 
Oriented Programming, OOP) 。 

创建 对 象 是 Python 的 核心 概念 ， 本 章 将 介绍 如 何 创建 对 象 ， 以 及 多 态 、 封 装 、 方 法 和 继承 等 
概念 。 


诊 


8.1 理解 面向 对 象 


8.1.1 什么 是 面向 对 象 编程 


Python 是 一 门面 向 对 象 编程 语言 ， 对 面向 对 象 语言 编码 的 过 程 叫 作 面 向 对 象 编程 。 

面向 对 象 编程 是 一 种 程序 设计 思想 ， 把 对 象 作为 程序 的 基本 单元 ， 一 个 对 象 包含 数据 和 操作 
数据 的 函数 。 

面向 对 象 程序 设计 把 计算 机 程序 视 为 一 组 对 象 的 集合 ， 每 个 对 象 都 可 以 接收 其 他 对 象 发 过 来 
的 消息 ， 并 处 理 这 些 消息 ， 计 算 机 程序 的 执行 就 是 一 系列 消息 在 各 个 对 象 之 间 传 递 。 

在 Python 中 ， 所 有 数据 类 型 都 被 视 为 对 象 ， 也 可 以 自 定义 对 象 。 自 定义 对 象 数 据 类 型 就 是 面 
向 对 象 中 的 类 (Class〉 的 概念 。 





8.1.2 面向 对 象 术语 简介 


在 开始 具体 介绍 面向 对 象 技术 之 前 ， 我 们 先 了 解 一 些 面向 对 象 的 术语 ， 以 便 在 后 续 内 容 中 碰 
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到 对 应 词 时 能 明白 这 些 术语 的 意思 。 
@ 类 : 用 来 描述 具有 相同 属性 和 方法 的 对 象 的 集合 。 类 定义 了 集合 中 每 个 对 象 共 有 的 属性 和 方 
法 。 对象 是 类 的 实例 。 
日 类 变量 (属性 ): 类 变量 在 整个 实例 化 的 对 象 中 是 公用 的 。 类 变量 定义 在 类 中 , 且 在 方法 之 外 。 
类 变量 通常 不 作为 实例 变量 使 用 。 类 变量 也 称 作 属性 。 
@ 数据 成 员 : 类 变量 或 实例 变量 用 于 处 理 类 及 其 实例 对 象 的 相关 数据 。 
方法 重 写 : 如 果 从 父 类 继承 的 方法 不 能 满足 子 类 的 需求 ， 就 可 以 对 其 进行 改写 ， 这 个 过 程 称 
为 方法 的 覆盖 (Override )， 也 称 为 方法 的 重 写 。 
实例 变量 : 定义 在 方法 中 的 变量 只 作用 于 当前 实例 的 类 。 
多 态 (Polymorphism ): 对 不 同类 的 对 象 使 用 同样 的 操作 。 
封装 (Encapsulation ): 对 外 部 世界 隐藏 对 象 的 工作 细节 。 
继承 ( Inheritance ): 即 一 个 派生 类 ( derived class ) 继承 基 类 (base class ) 的 字段 和 方法 。 继 
承 允许 把 一 个 派生 类 的 对 象 作为 一 个 基 类 对 象 对 待 ， 以 普通 类 为 基础 建立 专门 的 类 对 象 。 
实例 化 ( Instance ) 创建 一 个 类 的 实例 、 类 的 具体 对 象 。 
方法 : 类 中 定义 的 函数 。 
@ 对象: 通过 类 定义 的 数据 结构 实例 。 对 象 包 括 两 个 数据 成 员 (类 变量 和 实例 变量 ) 和 方法 。 
和 其 他 编程 语言 相 比 ，Python 在 尽 可 能 不 增加 新 语法 和 语义 的 情况 下 加 入 了 类 机 制 。 
Python 中 的 类 提供 了 面向 对 象 编程 的 所 有 基本 功能 ， 类 的 继承 机 制 允许 多 个 基 类 、 派 生 类 可 
以 覆盖 基 类 中 的 任何 方法 ， 方 法 中 可 以 调用 基 类 中 的 同名 方法 。 
对 象 可 以 包含 任意 数量 和 类 型 的 数据 。 


8.2 ”类 的 定义 与 使 用 


8.2.1 类 的 定义 


开始 介绍 前 先 看 一 个 类 的 示例 (my_class.py) : 


class MyClass (object) : 
i = 123 
def f(self): 
return "hello world’ 


由 上 面 的 代码 可 以 得 知 ， 类 定义 的 语法 格式 如 下 : 


class ClassName(object): 


<statement-1> 


166 | Python 3.7 从 零 开 始 学 





<statement-N> 


由 代码 片段 和 类 定义 我 们 看 到 ，Python 中 定义 类 使 用 class 关键 字 ，class 后 面 紧 接着 类 名 ， 如 
示例 中 的 MyClass， 类 名 通常 是 大 写 开头 的 单词 ; 紧 接着 是 (objecb， 表 示 该 类 是 从 哪个 类 继承 下 来 
的 。 通 常 ， 如 果 没 有 合适 的 继承 类 ， 就 使 用 object 类 ， 这 是 所 有 类 最 终 都 会 继承 的 类 。 类 包含 属性 
(相当 于 函数 中 的 语句 ) 和 方法 〈 类 中 的 方法 大 体 可 以 理解 成 第 7 章 所 学 的 函数 ) 。 





在 类 中 定义 方法 的 形式 和 函数 差不多 ， 但 不 称 为 函数 ， 而 称 为 方法 。 方 法 的 调用 需要 绑 定 
到 特定 对 象 上 ， 而 函数 不 需要 。 我 们 后 面 会 逐步 接触 方法 的 调用 方式 。 





8.2.2 ”类 的 使 用 


本 节 简 单 讲述 类 的 使 用 。 以 8.2.1 小 节 的 示例 为 例 〈 别 忘 了 写 开 头 两 行 ) ， 保 存 并 执行 
(my_calss_use.py， 程 序 编写 完成 后 ， 需 要 将 文件 保存 为 后 级 为 .py 的 文件 ， 在 cmd 命令 窗口 下 执 
行 .py 文件) : 

#! /usr/bin/python3 


# -*-coding:UTF-8-*- 


class MyClass (object): 
i = 123 
def f(self): 
return 'hello world' 


use class = MyClass() 

print (f' 调 用 类 的 属性 ，{use_class.i}') 

print (f' 调 用 类 的 方法 : {use_class.f£()}') 

执行 结果 如 下 : 

调用 类 的 属性 : 123 

调用 类 的 方法 : hello world 

由 输入 代码 中 的 调用 方式 可 知 ， 类 的 使 用 比 函数 调用 多 了 几 个 操作 ， 调 用 类 时 需要 执行 如 下 
操作 : 

use_class = MyClass() 

这 步 叫 作 类 的 实例 化 ， 即 创建 一 个 类 的 实例 。 此 处 得 到 的 use_class 变量 称 为 类 的 具体 对 象 。 
再 看 后 面 两 行 的 调用 : 

Print (f' 调 用 类 的 属性 : {use_class.i}') 

print (f' 调 用 类 的 方法 : {use_class.f()}') 


这 里 第 一 行 后 的 use_class.i 用 于 调用 类 的 属性 ， 也 就 是 我 们 前 面 所 说 的 类 变量 。 第 二 行 后 的 
use_class. 人 fi) 用 于 调用 类 的 方法 。 

在 上 面 的 示例 中 ， 在 类 中 定义 f0 方 法 时 带 了 一 个 self 参数 ， 该 参数 在 方法 中 并 没有 被 调用 ， 
是 否 可 以 不 要 呢 ? 调 用 人 方法 时 没有 传递 参数 ， 是 否 表示 参数 可 以 传递 也 可 以 不 传递 ? 
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对 于 在 类 中 定义 方法 的 要 求 : 在 类 中 定义 方法 时 ， 第 一 个 参数 必须 是 self。 除 第 一 个 参数 外 ， 
类 的 方法 和 普通 函数 没什么 区 别 , 如 可 以 用 默认 参数 、 可 变 参数 关键 字 参数 和 命名 关键 字 参 数 等 。 

对 于 在 类 中 调用 方法 的 要 求 : 要 调用 一 个 方法 ， 在 实例 变量 上 直接 调用 即 可 。 除 了 self 不 用 
传 外 ， 其 他 参数 均 正 常 传 入 。 

类 对 象 支持 两 种 操作 ， 即 属性 引用 和 实例 化 。 属 性 引用 的 标准 语法 如 下 : 





obj.name 


在 语法 中 ，obj 代表 类 对 象 ，name 代表 属性 。 
8.3 深入 类 


我 们 在 前 面 简单 介绍 了 类 的 定义 和 使 用 ， 本 节 将 深入 介绍 类 的 相关 内 容 ， 如 类 的 构造 方法 和 
访问 权限 。 


8.3.1 类 的 构造 方法 


在 开始 介绍 前 ， 我 们 对 前 面 的 示例 做 一 些 改动 ， 代 码 如 下 (my_calss_search.py》: 


#! /usr/bin/python3 
# -*-coding:UTF-8-*— 


class MyClass (object): 
i = 123 
def _init__ (self, name): 
self.name = name 


def f(self): 
return 'hello,'+ self.name 


use class = MyClass('xiaomeng') 
print (f' 调 用 类 的 属性 : {use_class.i}') 
print (f' 调 用 类 的 方法 {use_class.f£()}') 


程序 执行 结果 如 下 : 

调用 类 的 属性 : 123 

调用 类 的 方法 :hello, xiaomeng 

若 类 的 实例 化 语句 写法 和 之 前 一 样 ， 即 : 
use_class = MyClass() 

程序 执行 结果 如 下 : 


Traceback (most recent call last): 
File "D:/python/workspace/classdef.py", line 21, in <module> 
use class = MyClass() 
TypeError: _ init () missing 1 required positional argument: "name' 
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从 代码 和 输出 结果 看 到 ， 实 例 化 MyClass 类 时 调用 了 __init 0 方法 。 这 里 就 奇怪 了 ， 我 们 在 
代码 中 并 没有 指定 调用 _init _0 方 法， 怎么 会 报 _init _() 方 法 错误 呢 ? 

在 Python 中 ，_ init 0 方法 是 一 个 特殊 方法 ， 在 对 象 实例 化 时 会 被 调用 。_init _0 的 意思 是 
初始 化 ， 是 initialization 的 简写 。 这 个 方法 的 书写 方式 是 : 先 输入 两 个 下 画 线 ， 后 面 接着 init， 青 
接着 两 个 下 画 线 ， 最 后 加 上 小 括号 。 这 个 方法 也 叫 构造 方法 。 在 定义 类 时 ， 若 不 显 式 地 定义 一 个 
__init_() 方 法 , 则 程序 默认 调用 一 个 无 参 的 _init_() 方 法 。 比 如 以 下 两 段 代 码 的 使 用 效果 是 一 样 的 : 


代码 一 (default_init_1.py): 


#! /usr/bin/python3 
# =*=-Coding:UTF=8=*= 





class DefaultInit (object): 
def _init_ (self): 
print (' 类 实例 化 时 执行 我 ,我 是 “init 方法。') 


def show(self): 
print (' 我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 调用 。') 


test = DefaultInit() 
print (' 类 实例 化 结束 。' ) 

test.show() 

旦 序 执行 结果 如 下 : 

类 实例 化 时 执行 我 ， 我 是 _init _ 方法。 

类 实例 化 结束 。 

我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 调用 。 
代码 二 (default_init_2.py): 

#! /usr/bin/python3 

# -*-coding:UTF-8-*— 


class DefaultInit (object): 
def show(self) : 
print (" 我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 调用 。 ') 


test = DefaultInit() 

print (' 类 实例 化 结束 。' ) 

test .show() 

程序 执行 结果 如 下 : 

类 实例 化 结束 。 

我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 调用 。 

由 上 面 两 段 代 码 的 输出 结果 看 到 ， 当 代码 中 定义 了 __init 0 方法 时 ， 实 例 化 类 时 会 调用 该 方 
法 ; 若 没 有 定义 _init_() 方 法 ， 实 例 化 类 时 也 不 会 报错 ， 此 时 调用 默认 的 _init 0 方法 。 

在 Python 中 定义 类 时 车 没有 定义 构造 方法 (__init_(0) 方 法 ) ， 则 在 类 的 实例 化 时 系统 调用 默 
认 的 构造 方法 。 另 外 ，_init 0 方法 可 以 有 参数 ， 参 数 通 过 init () 传 递 到 类 的 实例 化 操作 上 。 

既然 _init _0 方 法 是 Python 中 的 构造 方法 ， 那 么 是 否 可 以 在 一 个 类 中 定义 多 个 构造 方法 呢 ? 
我 们 先 看 如 下 3 段 代码 : 





代码 一 (init_no_param.py): 





程序 执行 结果 如 下 : 





在 只 有 一 个 _init_() 方 法 时 ， 实 例 化 类 没有 什么 顾虑 。 
代码 二 (init_with_param_1.py): 





程序 执行 结果 如 下 : 


由 执行 结果 看 到 ， 调 用 的 是 带 了 一 个 param 参数 的 构造 方法 ， 若 把 类 的 实例 化 语句 更 改 为 : 


执行 结果 为 : 


或 更 改 为 : 


执行 结果 为 : 
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由 执行 结果 看 到 ， 实 例 化 类 时 只 能 调用 带 两 个 占 位 参数 的 构造 方法 ， 调 用 其 他 构造 方法 都 会 
报错 。 


代码 三 〈init_with_param_2.py): 


#! /usr/bin/python3 
# -*-coding:UTF-8-*- 


class DefaultInit (object): 
def init (self, param): 
Print (f' 我 是 带 一 个 参数 的 ”init 方法， 参数 值 为 ，{param} ') 


def init (self): 
print (' 我 是 不 带 参数 的 ”init 方法 。') 


DefaultInit () 
print (' 类 实例 化 结束 。') 


程序 执行 结果 如 下 : 


我 是 不 带 参 数 的 init 方法。 
类 实例 化 结束 。 


由 执行 结果 看 到 ， 调 用 的 构造 方法 除了 self 外 ， 没 有 其 他 参数 。 若 把 类 的 实例 化 语句 更 改 为 
如 下 : 

DefaultInit ('hello') 

执行 结果 为 : 

Traceback (most recent call last): 


File "D:/python/workspace/classdef.py", line 60, in <module> 
DefaultInit('hello') 


TypeError: _ init () takes 1 positional argument but 2 were given 
或 更 改 为 : 

DefaultInit ('hello', ‘world') 

执行 结果 为 : 


Traceback (most recent call last): 
File "D:/python/workspace/classdef.py", line 61, in <module> 
DefaultInit('hello', ‘world') 


TypeError: _init () takes 2 positional arguments but 3 were given 
由 执行 结果 看 到 ， 实 例 化 类 时 只 能 调用 带 一 个 占 位 参数 的 构造 方法 ， 调 用 其 他 构造 方法 都 会 
报错 。 


由 以 上 几 个 示例 我 们 得 知 : 一 个 类 中 可 定义 多 个 构造 方法 ， 但 实例 化 类 时 只 实例 化 最 后 的 构 
造 方法 , 即 后 面 的 构造 方法 会 覆盖 前 面 的 构造 方法 , 并 且 需 要 根据 最 后 一 个 构造 方法 的 形式 进行 实 
例 化 。 建 议 一 个 类 中 只 定义 一 个 构造 函数 。 
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8.3.2 ”类 的 访问 权限 


在 类 内 部 有 属性 和 方法 ， 外 部 代码 可 以 通过 直接 调用 实例 变量 的 方法 操作 数据 ， 这 样 就 隐藏 
了 内 部 的 复杂 逻辑 ， 例 如 (calss_access.py) : 


#! /usr/bin/python3 
# -*-coding:UTF-8-*-- 


class Student (object): 
def _init_ (self, 


name, Score) : 


self.name = name 


self.score = score 


def info(self): 


print (f' 学 生 : {self .name}; 分 数 : {self.score}') 


stu = Student ('xiaomeng', 95) 
print (f' 修 改 前 分 数 :， {stu.score}') 


stu.info() 
stu.score=0 


print (f' 修 改 后 分 数 :， {stu.score}') 


stu.info() 

程序 执行 结果 如 下 : 
修改 前 分 数 : 95 

学 生 ， xiaomeng; 分 数 : 95 


修改 后 分 数 : 0 
学 生 xiaomeng; 分 数 : 0 


由 代码 和 输出 结果 看 到 ， 在 类 中 定义 的 非 构造 方法 可 以 调用 类 中 构造 方法 实例 变量 的 属性 ， 


调用 的 方式 为 self. 实 例 变 量 





属性 名 ， 如 代码 中 的 selfname 和 self.score。 可 以 在 类 的 外 部 修改 类 的 


内 部 属性 。 如 果 要 让 内 部 属性 不 被 外 部 访问 ， 该 怎么 办 呢 ? 

要 让 内 部 属性 不 被 外 部 访问 ， 可 以 在 属性 名 称 前 加 两 个 下 画 线 _。 在 Python 中 ， 实 例 的 变量 
名 如 果 以 _ 开 头 ， 就 会 变 成 私有 变量 (private) ， 只 有 内 部 可 以 访问 ， 外 部 不 能 访问 。 据 此 ， 我 们 
把 Student 类 改 一 改 (student_class_1.py) : 


#! /usr/bin/python3 
# -*-coding:UTF-8-*- 


class Student (object): 
def init (self, 


name, score): 


self. name = name 


self._ score = score 


def info(self) : 


print (f' 学 生 ， {self. name}; 分 数 : {self. score}') 


stu = Student ('xiaomeng', 95) 
print (f' 修 改 前 分 数 : {stu. score}') 


stu.info() 
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stu. score = 0 
print (f "修改 后 分 数 : {stu. score}') 
stu.info() 


程序 执行 结果 如 下 : 


Traceback (most recent call last): 
File "D:/python/workspace/classdef .py", line 81, in <module> 
print (' 修 改 前 分 数 ; '，stu.__score) 
AttributeError: 'Student' object has no attribute '__score' 


由 执行 结果 看 到 ， 我 们 已 经 无 法 从 外 部 访问 实例 变量 的 属性 _score 了 。 这 样 有 什么 作用 呢 ? 
这 样 可 以 确保 外 部 代码 不 能 随意 修改 对 象 内 部 的 状态 ， 通 过 访问 限制 的 保护 ， 代 码 更 加 安全 。 


比如 上 面 的 分 数 对 象 是 一 个 比较 重要 的 内 部 对 象 , 如 果 外 部 可 以 随便 更 改 这 个 值 , 大 家 都 随便 更 改 
自己 成 绩 表单 中 的 分 数 ， 岂 不 是 很 混乱 。 


如 果 外 部 代码 要 获取 类 中 的 name 和 score， 怎 么 办 呢 ? 
在 Python 中 ， 可 以 为 类 增加 get_attrs 方法 ， 获 取 类 中 的 私有 变量 ， 例 如 在 上 面 的 示例 中 添加 


get_score (name 的 使 用 方式 类 同 ) 方法 ， 代 码 如 下 (student_calss 2.py) : 


#! /usr/bin/python3 
# -*-coding:UTF-8-*- 


class Student (object): 
def _init_ (self, name, score): 
self. name = name 
self.__score = score 


def info(self): 
print(f' 学 生 ，{self. name}; 分 数 : {self. score}') 


def get_score (self) : 
return self.__score 


stu = Student ('xiaomeng', 95) 
print (f' 修 改 前 分 数 : {stu.get_score()}') 
stu.info() 

print (f' 修 改 后 分 数 ; {stu.get_score()}') 
stu.info() 


执行 结果 如 下 : 

修改 前 分 数 ; 95 

学 生 : xiaomeng; 分 数 : 95 

修改 后 分 数 : 95 

学 生 : xiaomeng; 分 数 : 95 

由 执行 结果 看 到 ， 通 过 get_score 方法 已 经 可 以 正确 得 到 类 内 部 的 属性 值 。 

是 否 可 以 通过 外 部 更 改 内 部 私有 变量 的 值 呢 ? 

在 Python 中 , 可 以为 类 增加 set_attrs 方法 , 修改 类 中 的 私有 变量 , 例如 更 改 上 面 示例 中 的 score 





属性 值 ， 可 以 添加 set_score (name 的 使 用 方式 类 同 ) 方法 ， 代 码 如 下 〈student_calss 3.py) : 


#! /usr/bin/python3 
# -*-coding:UTF-8-*- 
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程序 执行 结果 如 下 : 


由 程序 执行 结果 看 到 ， 通 过 set_score 方法 正确 更 改 了 私有 变量 score 的 值 。 这 里 有 个 问题 ， 原 
先 stu.score=0 这 种 方式 也 可 以 修改 score 变量 ， 为 什么 要 费 这 么 大 周折 定义 私有 变量 ， 还 定义 
set_score 方法 呢 ? 

在 Python 中 ， 通 过 定义 私有 变量 和 对 应 的 set 方法 可 以 帮助 我 们 做 参数 检查 ， 避 免 传 入 无 效 
的 参数 ， 例 如 对 上 面 的 示例 更 改 如 下 (student_calss 4.py) : 
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程序 执行 结果 如 下 : 





由 输出 结果 看 到 ， 调 用 set_score 方法 时 ， 如 果 传 入 的 参数 不 满足 条 件 ， 就 按照 不 满足 条 件 的 
程序 逻辑 执行 。 

既然 类 有 私有 变量 的 说 法 ， 那 么 类 是 否 有 私有 方法 呢 ? 

答案 是 肯定 的 ， 类 也 有 私有 方法 。 类 的 私有 方法 也 是 以 两 个 下 画 线 开头 ， 声 明 该 方法 为 私有 
方法 ， 且 不 能 在 类 外 使 用 。 私 有 方法 的 调用 方式 如 下 : 


self. privatenethogs 
我 们 通过 下 面 的 示例 进一步 了 解 私 有 方法 的 使 用 (private_public_method.py) : 





程序 执行 结果 如 下 : 
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开始 调用 私有 方法 : 
Traceback (most recent call last): 
File "D:/python/workspace/classdef.py", line 114, in <module> 
Pri pub. foo() 
AttributeError: 'PrivatePublicMethod' object has no attribute '__ foo' 


由 输出 结果 看 到 ， 私 有 方法 和 私有 变量 类 似 ， 不 能 通过 外 部 调用 。 
84 继 承 


面向 对 象 编程 带 来 的 好 处 之 一 是 代码 的 重用 ， 实 现 重用 的 方法 之 一 是 通过 继承 机 制 。 继 承 完 
全 可 以 理解 成 类 之 间 类 型 和 子 类 型 的 关系 。 

在 面向 对 象 程序 设计 中 ， 当 我 们 定义 一 个 class 时 ， 可 以 从 某 个 现 有 的 class 继承 ， 定 义 的 新 
class 称 为 子 类 〈Subclass) ， 而 被 继承 的 class 称 为 基 类 、 父 类 或 超 类 (Base class、Super class) 。 

继承 的 定义 如 下 : 


class DerivedClassName (BaseClassName): 
<statement-1> 


<statement-N> 


需要 注意 : 继承 语法 class 子 类 名 〈 基 类 名 ) 时 ，// 基 类 名 写 在 括号 里 ， 基 本 类 是 在 定义 类 时 ， 
在 元 组 中 指明 的 。 

在 Python 中 ， 继 承 有 以 下 特点 : 

(1) 在 继承 中 ， 基 类 的 构造 方法 (__init_0 方 法 ) 不 会 被 自动 调用 ， 需 要 在 子 类 的 构造 方法 
中 专门 调用 。 

(2) 在 调用 基 类 的 方法 时 需要 加 上 基 类 的 类 名 前 级 ， 并 带 上 self 参数 变量 。 区 别 于 在 类 中 调 
用 普通 函数 时 不 需要 带 self 参数 。 

(3) 在 Python 中 ， 首 先 查找 对 应 类 型 的 方法 ， 如 果 在 子 类 中 找 不 到 对 应 的 方法 ， 才 到 基 类 中 
逐个 查找 。 

例如 (Canimal.py) : 

#! /usr/bin/python3 


# =*= CodlngiUTE=8, 一 “一 


class Animal (object): 
def run(self) : 
print('Animal is running...') 
上 面 定义 了 一 个 名 为 Animal 的 类 ,类 中 定义 了 一 个 run() 方 法 直接 输出 (没有 显 式 定义 _init_() 
方法 ， 会 调用 默认 的 构造 方法 ) 。 在 编写 Dog 和 Cat 类 时 ， 可 以 直接 从 Animal 类 继承 ， 定 义 如 下 
(Canimalpy) : 


class Dog(Rnimal) : 
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在 这 段 代码 片段 中 ， 对 于 Dog 来 说 ，Animal 就 是 它 的 父 类 ; 对 于 Animal 来 说 ，Dog 就 是 它 
的 子 类 。Cat 和 Dog 类 似 。 


继承 有 什么 好 处 ? 

继承 最 大 的 好 处 是 子 类 获得 了 父 类 全 部 非 私 有 的 功能 。 由 于 在 Animial 中 定义 了 非 私有 的 run() 
方法 ， 因 此 作为 Animial 的 子 类 ，Dog 和 Cat 什么 方法 都 没有 定义 ， 自 动 拥有 父 类 中 的 run() 方 法 。 

执行 以 上 代码 : 





程序 执行 结果 如 下 : 





由 执行 结果 看 到 ， 子 类 中 没有 定义 任何 方法 ， 但 都 成 功 执行 了 run() 方 法 。 
当然 ， 子 类 可 以 拥有 一 些 自己 的 方法 ， 比 如 在 Dog 类 中 增加 一 个 eat 方法 : 





以 上 代码 执行 结果 如 下 : 





由 执行 结果 看 到 ， 既 执行 了 父 类 的 方法 ， 又 执行 了 自己 定义 的 方法 。 
子 类 不 能 继承 父 类 中 的 私有 方法 ， 也 不 能 调用 父 类 的 私有 方法 。 父 类 的 定义 如 下 【完整 代码 
见 animal 1.py) : 
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子 类 定义 不 变 ， 执 行 如 下 调用 语句 : 


执行 结果 如 下 : 





由 执行 结果 看 到 ， 子 类 不 能 调用 父 类 的 私有 方法 ， 子 类 虽然 继承 了 父 类 ， 但 是 调用 父 类 的 私 
有 方法 相当 于 从 外 部 调用 类 中 的 方法 ， 因 而 调用 不 成 功 。 
对 于 父 类 中 扩展 的 非 私有 方法 ， 子 类 可 以 拿 来 即 用 ， 如 在 父 类 Animal 中 增加 一 个 jump 方法 
(完整 代码 见 animal 2.py) : 





上 面 我 们 增加 了 一 个 非 私 有 的 jump0 方 法 ， 子 类 Dog 和 Cat 保持 原样 ， 执 行 如 下 调用 : 





执行 结果 如 下 : 





由 执行 结果 看 到 ， 子 类 可 以 立即 获取 父 类 增加 的 非 私 有 方法 。 
继承 可 以 一 级 一 级 继承 下 来 ， 就 好 比 从 爷爷 到 爸爸 再 到 儿子 的 关系 。 所 有 类 最 终 都 可 以 追溯 
到 根 类 object， 这 些 继承 关系 看 上 去 就 像 一 颗 倒 着 的 树 ， 如 图 8-1 所 示 。 
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图 8-1 继承 树 


8.5 多 4 


我 们 在 8.4 节 讲述 了 继承 ， 继 承 可 以 帮助 我 们 重复 使 用 代码 。 但 对 于 继承 中 的 示例 ， 无 论 是 
Dog 还 是 Cat, 调用 父 类 的 run() 方 法 时 显示 的 都 是 Animal is running.… 如果 想 让 结果 显示 为 Dog is 
running... 和 Cat is running.…， 该 怎么 处 理 呢 ? 

我 们 对 Dog 和 Cat 类 做 如 下 改进 〈 完 整 代码 见 animal 3.py) : 





执行 如 下 语句 : 





执行 结果 如 下 : 
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由 执行 结果 看 到 ， 分 别 得 到 了 Dog 和 Cat 各 自 的 running 结果 。 

当 子 类 和 父 类 存在 相同 的 run() 方 法 时 ， 子 类 的 run() 方 法 会 覆盖 父 类 的 run() 方 法 , 在 代码 运行 
时 总 是 会 调用 子 类 的 run() 方 法 ， 称 之 为 多 态 。 

多 态 来 自 于 希腊 语 ， 意 思 是 有 多 种 形式 。 多 态 意味 着 即使 不 知道 变量 所 引用 的 对 象 类 型 是 什 
么 ,也 能 对 对 象 进行 操作 ， 多 态 会 根据 对 象 (或 类 ) 的 不 同 而 表现 出 不 同 的 行为 。 例 如 ， 我 们 在 上 
面 的 Animal 类 中 定义 了 run 方法 ，Dog 和 Cat 类 分 别 继承 Animal 类 ， 并 且 分 别 定 义 了 自己 的 run 
方法 ， 最 后 Dog 和 Cat 调用 的 是 自己 定义 的 run 方法 。 

为 了 更 好 地 理解 什么 是 多 态 ， 我 们 对 数据 类 型 再 做 一 点 说 明 。 当 我 们 定义 一 个 类 时 ， 实 际 上 
就 定义 了 一 种 数据 类 型 。 定 义 的 数据 类 型 和 Python 自 带 的 数据 类 型 (如 str、list、dict) 没什么 两 
样 ( 完 整 代码 见 animal 4.py) 。 

a = list() # a 是 1ist 类 型 

b = Animal() # b 是 Animal 类 型 

c = Dog() # c 是 Dog 类 型 

下 面 用 isinstance() 方 法 判断 一 个 变量 是 否 是 某 个 类 型 〈 完 整 代码 见 animal 4.py) 。 


print (f'a 是 否 为 1ist 类 型 : {isinstance(a, list)}') 
print (f'b 是 否 为 Animal 类 型 : {isinstance (b，Animal)}') 
print (f'c 是 否 为 Dog 类 型 : {isinstance (c，Dog)}') 


执行 结果 如 下 : 

a 是 否 为 1ist 类 型 True 

b 是 否 为 Animal 类 型 True 

c 是 否 为 Dog 类 型 : True 

由 执行 结果 看 到 ，a、b、c 确实 分 别 为 list、Animal、Dog 三 种 类 型 。 我 们 再 执行 如 下 语句 〈 完 
整 代码 见 animal 4.py) : 


print (f'c 是 否 为 Dog 类 型 : {isinstance (c，Dog)}') 
print (f'c 是 否 为 Animal 类 型 {isinstance(c, Animal)}') 


执行 结果 如 下 : 

c 是 否 为 Dog 类 型 True 

c 是 否 为 Animal 类 型 : True 

由 执行 结果 看 到 ，c 既是 Dog 类 型 又 是 Animal 类 型 。 这 怎么 理解 呢 ? 

因为 Dog 是 从 Animal 继承 下 来 的 ， 当 我 们 创建 Dog 的 实例 c 时 ， 我 们 认为 c 的 数据 类 型 是 
Dog， 但 ec 同时 也 是 Animal，Dog 本 来 就 是 Animal 的 一 种 。 

在 继承 关系 中 ， 如 果 一 个 实例 的 数据 类 型 是 某 个 子 类 ， 那 它 的 数据 类 型 也 可 以 看 作 是 父 类 。 
但 是 反 过 来 就 不 行 ， 例 如 以 下 语句 〈 完 整 代码 见 animal 4.py) : 


b = Animal() 
print (f'b 是 否 为 Dog 类型， {isinstance (b，Dog)}') 


执行 结果 如 下 : 
b 是 否 为 Dog 类 型 : False 
由 输出 结果 看 到 ， 变 量 b 是 Animal 的 实例 化 对 象 ， 是 Animal 类 型 ， 但 不 是 Dog 类 型 ， 也 就 
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是 Dog 可 以 看 成 Animal， 但 Animal 不 可 以 看 成 Dog。 

我 们 再 看 一 个 示例 。 编 写 一 个 函数 ， 这 个 函数 接收 一 个 Animal 类 型 的 变量 ， 定 义 并 执行 如 下 
函数 ， 执 行 时 传 入 Animal 的 实例 〈 完 整 代码 见 animal 5.py) : 

#! /usr/bin/python3 


# -*= coding:UTF-8 一 * 一 


def run two times(animal): 
animal. run() 
animal. run() 


run two_times (Animal()) 
执行 结果 如 下 : 


Animal is running... 
Animal is running... 


若 执 行 函数 时 传 入 Dog 的 实例 ， 操 作 如 下 完整 代码 见 animal 5.py) : 
run_ two_times (Dog()) 
得 到 执行 结果 如 下 : 


Dog is running... 
Dog is running... 


若 传 入 Cat 的 实例 ， 操 作 如 下 (完整 代码 见 animal 5.py) : 
run_ two_times (Cat ()) 
得 到 执行 结果 如 下 : 


Cat is running... 
Cat is running... 


看 上 去 没有 什么 特殊 的 地 方 ， 已 经 正确 输出 预期 结果 了 , 但 是 仔细 想 想 , 如 果 再 定义 一 个 Bird 
类 型 ， 也 继承 Animal 类 ， 定 义 如 下 完整 代码 见 animal 6.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 —*— 


class Bird(Animal): 
def run(self) : 
print('Bird is flying the sky...') 


run_two_times (Bird()) 


程序 执行 结果 如 下 : 


Bird is flying the sky... 
Bird is flying the sky... 


由 执行 结果 我 们 发 现 ， 新 增 的 Animal 子 类 不 必 对 run_two_times() 方 法 做 任何 修改 。 实 际 上 ， 
任何 依赖 Animal 作为 参数 的 函数 或 方法 都 可 以 不 加 修改 地 正常 运行 ， 原 因 就 在 于 多 态 。 

多 态 的 好 处 是 : 当 我 们 需要 传 入 Dog、Cat、Bird 等 对 象 时 , 只 需要 接收 Animal 类 型 就 可 以 了 ， 
因为 Dog、Cat、 Bird 等 都 是 Animal 类 型 , 按照 Animal 类 型 进行 操作 即 可 。 由 于 Animal 类 型 有 run() 
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方法 ， 因 此 传 入 的 类 型 只 要 是 Animal 类 或 继承 自 Animal 类 ， 都 会 自动 调用 实际 类 型 的 run() 方 法 。 

多 态 的 意思 是 : 对 于 一 个 变量 , 我 们 只 需要 知道 它 是 Animal 类 型 ,无 须 确切 知道 它 的 子 类 型 ， 
就 可 以 放心 调用 run() 方 法 。 具 体 调用 的 run() 方 法 作用 于 Animal、Dog、Cat 或 Bird 对 象 ， 由 运行 
时 该 对 象 的 确切 类 型 决定 。 

多 态 真正 的 威力 在 于 : 调用 方 只 管 调用 ， 不 管 细节 。 当 我 们 新 增 一 种 Animal 的 子 类 时 ， 只 要 
确保 run0 方 法 编写 正确 即 可 ， 不 用 管 原来 的 代码 是 如 何 调用 的 。 这 就 是 著名 的 “ 开 闭 ”原则 : 对 
于 扩展 开放 , 允许 新 增 Animal 子 类 ; 对 于 修改 封闭 ,不 需要 修改 依赖 Animal 类 型 的 run_two_times() 

很 多 函数 和 运算 符 都 是 多 态 的 ， 你 写 的 绝 大 多 数 程序 也 可 能 是 ， 即 便 你 并 非 有 意 这 样 。 只 要 
使 用 多 态 函 数 和 运算 符 , 多 态 就 会 消除 。 唯一 能 够 毁 掉 多 态 的 是 使 用 函数 显 式 地 检查 类 型 , 如 type、 
isinstance 函数 等 。 如 果 有 可 能 ， 就 尽量 避免 使 用 这 些 毁 掉 多 态 的 方式 ， 重 要 的 是 如 何 让 对 象 按照 
我 们 希望 的 方式 工作 ， 无 论 它 是 否 是 正确 的 类 型 或 类 。 





8.6 封 装 


前 面 两 节 我 们 讲述 了 Python 对 象 中 的 两 个 重点 一 继承 和 多 态 ， 本 节 将 讲述 第 3 个 重点 一 一 
封装 。 

封装 是 全 局 作用 域 中 其 他 区 域 隐藏 多 余 信息 的 原则 。 听 起 来 有 些 像 多 态 ， 使 用 对 象 而 不 用 知 
道 其 内 部 细节 。 它 们 都 是 抽象 原则 ， 都 会 帮忙 处 理 程序 组 件 而 不 用 过 多 关心 细节 ， 就 像 函 数 一 样 。 

封装 并 不 等 同 于 多 态 。 多 态 可 以 让 用 户 对 不 知道 类 〈 或 对 象 类 型 ) 的 对 象 进行 方法 调用 ， 而 
封装 可 以 不 用 关心 对 象 是 如 何 构建 的 ， 直 接 使 用 即 可 。 

前 面 几 节 的 示例 基本 都 用 到 封装 的 思想 ， 如 前 面 定义 的 Student 类 中 ， 每 个 实例 都 拥有 各 自 的 
name 和 score 数据 。 我 们 可 以 通过 函数 访问 这 些 数据 ， 如 输出 学 生 的 成 绩 ， 可 以 如 下 定义 并 执行 
(student.py) : 


#! /usr/bin/python3 
# -*— coding:UTF-8 一 * 一 


class Student (object): 
def init (self, name, score): 
self.name = name 
self.score = Score 


std = Student ('xiaozhi', 90) 
def info(std) : 

Print (f' 学 生 ， {std.name}; 分 数 : {std.score}') 
info (std) 


执行 结果 为 : 
学 生 : xiaozhi; 分 数 : 90 
由 输出 结果 看 到 ， 可 以 通过 函数 调用 类 并 得 到 结果 。 
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既然 Student 实例 本 身 就 拥有 这 些 数据 ， 要 访问 这 些 数据 就 没有 必要 从 外 面 的 函数 访问 ， 可 以 
直接 在 Student 类 内 部 定义 访问 数据 的 函数 ， 这 样 就 把 “数据 ”封装 起 来 了 。 这 些 封装 数据 的 函数 
和 Student 类 本 身 是 相关 联 的 , 我 们 称 之 为 类 的 方法 .于 是 就 有 了 前 面 所 写 类 的 形式 (student_0.py): 

#! /usr/bin/python3 


# —*= codingUTE-8 一 “一 


class Student0 (object): 
def _ init (self, name, score): 
self.name = name 
self.score = score 


def info(self): 
print (f' 学 生 : {self .name}; 分 数 : {self.score}') 


要 定义 一 个 方法 ， 除 了 第 一 个 参数 是 self 外 ， 其 他 参数 和 普通 函数 一 样 。 要 调用 一 个 方法 ， 
在 实例 变量 上 直接 调用 即 可 。 除 了 self 不 用 传递 外 ， 其 他 参数 均 正常 传 入 ， 执 行 如 下 语句 : 


stu = Student0('xiaomeng',95) 
stu.info() 


执行 结果 为 : 

学 生 ， xiaomeng; 分 数 : 95 

这 样 一 来 ,我们 从 外 部 看 Student 类 ， 只 需要 知道 创建 实例 需要 给 出 的 name 和 score， 如 何 输 
出 是 在 Student 类 的 内 部 定义 的 ， 这 些 数 据 和 逻辑 被 “封装 ”起 来 了 ， 调 用 很 容易 ， 但 却 不 用 知道 
内 部 实现 的 细节 。 

封装 的 另 一 个 好 处 是 可 以 给 Student 类 增加 新 方法 ， 比 如 我 们 在 类 的 访问 权限 中 所 讲述 的 
get_score() 方 法 和 set_score() 方 法 。 使 用 这 些 方法 时 ， 我 们 无 须知 道内 部 实现 细节 ， 直 接 调 用 即 可 。 


8.7 多重 继承 


8.6 节 讲述 的 是 单 继承 ，Python 还 支持 多 重 继承 。 多 重 继承 的 类 定义 如 下 : 


class DerivedClassName (Basel, Base2, Base3): 
<statement-1> 


ee 
可 以 看 到 ， 多 重 继承 就 是 有 多 个 基 类 ( 父 类 或 超 类 ) 。 
需要 注意 圆 括 号 中 父 类 的 顺序 ， 若 父 类 中 有 相同 的 方法 名 ， 在 子 类 使 用 时 未 指定 ，Python 会 
从 左 到 右 搜索 。 若 方法 在 子 类 中 未 找到 ， 则 从 左 到 右 查 找 父 类 中 是 否 包含 该 方法 。 
继续 以 前 面 的 Animal 类 为 例 ， 假 设 要 实现 4 种 动物 : Dog ( 狗 ) 、Bat (蝙蝠 ) 、Parrot ( 鹦 
起 ) 、Ostrich (能 鸟 ) 。 
如 果 按 照 哺乳 动物 和 鸟 类 分 类 ,我 们 可 以 设计 按 哺乳 动物 分 类 的 类 层次 图 , 如 图 8-2 所 示 。 如 
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果 按 照 “ 能 跑 ” 和 “能 飞 ” 分 类 ， 我 们 可 以 设计 按 行为 功能 分 类 的 类 层次 图 ， 如 图 8-3 所 示 。 
如 果 要 把 上 面 的 两 种 分 类 都 包含 进来 ， 就 得 设计 更 多 层次 。 


哺乳 类 : 包括 能 跑 的 哺乳 类 和 能 飞 的 哺乳 类 。 
鸟 类 : 包括 能 跑 的 鸟 类 和 能 飞 的 鸟 类 。 


Animal Animal 


> NN 
人 Mammal )( Bird ) (_ Runnable )( Flyable ) 


NY NN 
(ee CR Ca (Cooo )Couer)(rarer )C ea ) 


图 8-2 按 哺 乳 动物 分 类 的 类 层次 图 图 8-3 ” 按 行 为 功能 分 类 的 类 层次 图 
这 么 一 来 ， 类 的 层次 就 复杂 了 。 图 8-4 所 示 为 更 复杂 的 类 层次 图 。 


Eo 
Mammal Bird 


YS 


Ostrich Parrot 


图 84 更 复杂 的 类 层次 图 
如 果 还 要 增加 “宠物 类 ”和 “ 非 宠 物 类 ”， 类 的 数量 就 会 呈 指 数 增 长 ， 很 明显 这 样 设计 是 不 
行 的 。 
正确 的 做 法 是 采用 多 重 继承 。 首 先 ， 主 要 的 类 层次 仍 按照 哺乳 类 和 鸟 类 设计 ， 设 计 代 码 如 下 
(animal 7.py) : 
































#! /usr/bin/python3 

# -*~ coding:UTR-8 一“ 一 

class Animal (object): 
pass 

# 大 类 : 

class Mammal (Animal): 
pass 
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class Bird(Animal): 
Pass 


# 各 种 动物 : 

class Dog(Mammal) : 
Pass 

class Bat (Mammal) : 


Pass 


class Parrot(Bird) : 
Pass 


class Ostrich(Bird) : 
Pass 


接 下 来 ， 给 动物 加 上 Runnable 和 Flyable 功能 。 我 们 先 定义 好 Runnable 和 Flyable 类 : 
#! /usr/bin/python3 
# -*- coding:UTF-8 一 * 一 


class Runnable (object): 
def runl(self): 
print('Running...') 


class Flyable (object): 
def fly(self) : 
print('Flying...') 


大 类 定义 好 后 ， 对 需要 Runnable 功能 的 动物 添加 对 Runnable 的 继承 ， 如 Dog: 


class Dog(Mammal, Runnable): 
pass 


对 需要 Flyable 功能 的 动物 添加 对 Flyable 的 继承 ， 如 Bat: 


class Bat (Mammal, Flyable): 
pass 


这 样 ， 通 过 上 面 的 多 重 继承 ， 一 个 子 类 就 可 以 继承 多 个 父 类 ， 同 时 获得 多 个 父 类 的 所 有 非 私 
有 功能 。 


8.8 获取 对 象 信息 


当 我 们 调用 方法 时 可 能 需要 传递 一 个 参数 ， 这 个 参数 类 型 我 们 知道 ， 但 是 对 于 接收 参数 的 方 
法 ， 就 不 一 定 知道 是 什么 参数 类 型 了 。 我 们 该 怎么 得 知 参 数 的 类 型 呢 ? 

Python 为 我 们 提供 了 以 下 3 种 获取 对 象 类 型 的 方法 。 

1. 使 用 type() 函 数 

我 们 前 面 已 经 学 习 过 type0 函 数 的 使 用 ， 基 本 类 型 都 可 以 用 typeO 判 断 ， 例 如 : 


>>> type (123) 
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<class "int"> 

>>> type('abc') 
<class 'str'> 

>>> type (None) 
<class 'NoneType'> 


如 果 一 个 变量 指向 函数 或 类 ， 用 type() 函 数 返 回 的 是 什么 类 型 ? 在 交互 模式 下 输入 : 


>>> type (abs) 

<class 'builtin function or method'> 

>>> type (pri_pub) “# 上 一 节 定 义 的 PrivatePublicMethod 类 
<class '_main .PrivatePublicMethod'> 


由 输出 结果 看 到 ， 返 回 的 是 对 应 的 Class 类 型 。 
如 果 我 们 要 在 让 语句 中 判断 并 比较 两 个 变量 的 type 类 型 是 否 相 同 ， 应 如 下 操作 : 


>>> type (123)==type (456) 
True 

>>> type (123) ==int 

True 

>>> type('abc')==type('123') 
True 

>>> type('abc')==str 

True 

>>> type('abc')==type (123) 
False 


通过 操作 我 们 看 到 ， 判 断 基本 数据 类 型 可 以 直接 写 int、str 等 。 怎 么 判断 一 个 对 象 是 否 是 函数 








可 以 使 用 types 模块 中 定义 的 常量 ， 在 交互 模式 下 输入 : 


>>> import types 
>>> def func(): 
pass 


>>> type (fn)==types.FunctionType 

True 

>>> type (abs)==types.BuiltinFunctionType 

True 

>>> type (lambda x: x)==types.LambdaType 

True 

>>> type((x for x in range(10)))==types.GeneratorType 
True 


由 执行 结果 看 到 ， 函 数 的 判断 方式 需要 借助 types 模块 的 帮助 。 
2. 使 用 isinstance() 函 数 


要 明确 class 的 继承 关系 ， 使 用 type() 很 不 方便 ， 通 过 判断 class 的 数据 类 型 确定 class 的 继承 
关系 要 方便 得 多 ， 这 个 时 候 可 以 使 用 isinstance() 函 数 。 
例如 ， 继 承 关 系 是 如 下 形式 : 


object -> Animal -> Dog 


即 Animal 继承 object、Dog 继承 Animal。 使 用 isinstance() 可 以 告诉 我 们 一 个 对 象 是 否 是 某 种 
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例如 ， 创 建 如 下 两 种 类 型 的 对 象 : 


>>> animal = Rnimal () 
>>> dog = Dog() 


对 上 面 两 种 类 型 的 对 象 ， 使 用 isinstance 进行 判断 : 


>>> isinstance (dog, Dog) 
True 


根据 输出 结果 看 到 ，dog 是 Dog 类 型 ， 这 个 没有 任何 疑问 ， 因 为 dog 变量 指向 的 就 是 Dog 对 
象 。 接 下 来 判断 Animal 类 型 ， 使 用 isinstance 判断 如 下 : 


>>> isinstance (dog, Animal) 
True 


根据 输出 结果 看 到 ，dog 也 是 Animal 类 型 。 

由 此 我 们 得 知 : 尽管 dog 是 Dog 类 型 ， 不 过 由 于 Dog 是 从 Animal 继承 下 来 的 ， 因 此 dog 也 
是 Animal 类 型 。 换 名 话说 ，isinstance() 判 断 的 是 一 个 对 象 是 否 为 该 类 型 本 身 ， 或 者 是 否 为 该 类 型 
继承 类 的 类 型 。 

我 们 可 以 确信 ，dog 还 是 object 类 型 : 

>>> isinstance (dog, object) 

True 


同时 确信 ， 实 际 类 型 是 Dog 类 型 的 dog， 同 时 也 是 Animal 类 型 : 


>>> isinstance (dog, Dog) and isinstance (dog, Animal) 
True 


不 过 animal 不 是 Dog 类 型 ， 这 个 我 们 在 8.5 节 已 经 讲述 过 : 


>>> isinstance (animal,Dog ) 
False 


提醒 一 点 ， 能 用 type0 判 断 的 基本 类 型 也 可 以 用 isinstance() 判 断 。 这 个 可 以 自己 进行 验证 。 
isinstance() 可 以 判断 一 个 变量 是 否 为 某 些 类 型 中 的 一 种 , 判断 变量 是 否 为 list 或 tuple 的 方式 如 


>>> isinstance([1, 2, 3], (list, tuple)) 
True 
>>> isinstance((1, 2, 3), (list, tuple)) 
True 


3. 使 用 dir() 


如 果 要 获得 一 个 对 象 的 所 有 属性 和 方法 ， 就 可 以 使 用 dir0 函 数 。dir0 函 数 返 回 一 个 字符 串 的 
list。 例 如 ， 获 得 一 个 str 对 象 的 所 有 属性 和 方法 的 方式 如 下 : 


>>> dir('abc') 














机 
format ','_ ge _','_ getattribute ',' getitem ',' getnewargs '，'_ gt ','_hash _', 
.TR 





'_reduce '，' reduce ex ', '_ repr '，' rmod "，" rmul ', '_ setattr ', '_ sizeof_', 
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'_str ','_ subclasshook ', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 
'expandtabs', 'find', 'format', 'format map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 
"isidentifier'， 'islower', 'isnumeric', ‘isprintable', 'isspace', 'istitle', 'isupper', 'join', 
‘ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 
'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 
'translate', 'upper', 'zfill'] 


由 输出 结果 看 到 ，str 对 象 包含 许多 属性 和 方法 。 
8.9 类 的 专 有 方法 


我 们 前 面 讲述 了 类 的 访问 权限 、 私 有 变量 和 私有 方法 ， 除 了 自 定 义 私 有 变量 和 方法 外 ，Python 
类 还 可 以 定义 专 有 方法 。 专 有 方法 是 在 特殊 情况 下 或 使 用 特别 语法 时 由 Python 调用 的 ， 而 不 是 像 
普通 方法 一 样 在 代码 中 直接 调用 。 本 节 讲 述 几 个 Python 常用 的 专 有 方法 。 

看 到 形 如 _xxx_ 的 变量 或 函数 名 就 要 注意 ， 这 在 Python 中 是 有 特殊 用 途 的 。 

_init_ 我 们 已 经 知道 怎么 用 了 , Python 的 class 中 有 许多 这 种 有 特殊 用 途 的 函数 , 可 以 帮助 我 
们 定制 类 。 下 面 介绍 这 种 特殊 类 型 的 函数 定制 类 的 方法 。 

人 

开始 介绍 之 前 ， 我 们 先 定 义 一 个 Student 类 ， 定 义 如 下 〈student_1.py) : 

#! /usr/bin/python3 


# =*= coding:UTF-8 一 * 一 


class Student (object) : 
def _init_ (self，name) : 
self.name = name 


print (Student ('xiaozhi')) 

执行 结果 如 下 : 

<_main_ .Student object at 0x0000000000D64198> 

执行 结果 输出 一 堆 字符 串 ， 一 般 人 看 不 懂 ， 没 有 什么 可 用 性 。 怎 样 才能 输出 得 好 看 呢 ? 

我 们 只 需要 定义 好 _str_() 方 法 ， 返 回 一 个 易 懂 的 字符 串 就 可 以 了 。 重 新 定义 上 面 的 示例 
(student 2.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 -*— 


class Student (object): 
def _init (self, name): 
self.name = name 


def _str_ (self): 


return f' 学 生 名 称 : {self.name}' 


print (Student ('xiaozhi')) 
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执行 结果 为 : 
学 生 名 称 : xiaozhi 
由 执行 结果 看 到 ， 这 样 输出 的 实例 不 但 易 懂 ， 而 且 是 我 们 想 要 的 。 


如 果 在 交互 模式 下 输入 如 下 : 
>>> s = Student('xiaozhi') 
SS 


<_ main .Student object at 0x00000000030EC550> 


由 执行 结果 看 到 ， 输 出 的 实例 还 跟 之 前 一 样 ， 不 容易 识别 。 
这 是 因为 直接 显示 变量 调用 的 不 是 _str _(), 而 是 _repr ()， 两 者 的 区 别 在 于 _str _0 返 回 用 




















户 看 到 的 字符 串 ， 而 _repr_0 返 回程 序 开 发 者 看 到 的 字符 串 。 也 就 是 说 ，_repr_() 是 为 调试 服务 


的 。 


解决 办 法 是 再 定义 一 个 _repr_(0。 通 常 ，_str_0 和 _ repr_0 的 代码 是 一 样 的 ， 所 以 有 一 个 





偷懒 的 写法 〈student 3.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 -*— 


class Student (object): 
def _ init (self, name): 
self.name = name 


def _ str__(self): 
return f' 学 生 名 称 : {self.name}' 
—repr = _str_ 


在 交互 模式 下 执行 : 


>>> s = Student('xiaozhi') 
>>> S 


学 生 名 称 : xiaozhi 

可 以 看 到 ， 已 经 得 到 满意 的 结果 了 。 

2._iter 

如 果 想 将 一 个 类 用 于 for … in 循环 ， 类 似 list 或 tuple 一 样 ， 就 必须 实现 一 个 _iter _0 方 法 。 


该 方法 返回 一 个 迭代 对 象 ，Python 的 for 循环 会 不 断 调用 该 迭代 对 象 的 _next 0 方法， 获得 循环 


的 下 


一 个 值 ， 直 到 遇 到 StopIteration 错误 时 退出 循环 。 

我 们 以 斐 波 那 契 数列 为 例 ， 写 一 个 可 以 作用 于 for 循环 的 Fib 类 (fib_class_1.py): 
#! /usr/bin/python3 

# -*- coding:UTF-8 —*— 


class Fib(object) : 
def _init (self): 
self.a，self.b = 0，1 # 初始 化 两 个 计数 器 a、b 


def _ iter (self): 
return self # 实例 本 身 就 是 选 代 对 象 ， 故 返回 自己 
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下 面 我 们 把 Fib 实例 作用 于 for 循环 。 





3. _getitem_ 
Fib 实例 虽然 能 够 作用 于 for 循环 ， 和 list 有 点 像 ， 但 是 不 能 将 它 当成 list 使 用 。 比 如 取 第 3 个 
元 素 : 





由 执行 结果 看 到 ， 取 元 素 时 报错 了 。 人 怎么 办 呢 ? 
要 像 list 一 样 按照 下 标 取出 元 素 ， 需 要 实现 _getitem_() 方 法 ， 代 码 如 下 〈fib_class 2.py) : 





下 面 尝试 取得 数列 的 值 : 





由 执行 结果 看 到 ， 可 以 成 功 获取 对 应 数列 的 值 了 。 
4._getattr _ 


正常 情况 下 , 调用 类 的 方法 或 属性 时 , 如 果 类 的 方法 或 属性 不 存在 就 会 报错 。 比 如 定义 Student 
类 (student 4.py) : 
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self.name = name 








对 于 上 面 的 代码 ， 调 用 name 属性 不 会 有 任何 问题 ， 但 是 调用 不 存在 的 score 属性 就 会 报错 。 
执行 以 下 代码 : 
>>> stu = Student('xiaozhi') 
>>> print(stu.name) 
Xiaozhi 
>>> print(stu.score) 
Traceback (most recent call last): 
File "<pyshell#50>", line 1, in <module> 

print (stu.score) 

AttributeError: 'Student' object has no attribute 'score' 


由 输出 结果 看 到 , 错误 信息 告诉 我 们 没有 找到 score 属性 。 对 于 这 种 情况 , 有 什么 解决 方法 吗 ? 
要 避免 这 个 错误 ， 除 了 可 以 添加 一 个 score 属性 外 ，Python 还 提供 了 另 一 种 机 制 ， 就 是 写 一 个 
__getattr_() 方 法 ， 动 态 返 回 一 个 属性 。 上 面 的 代码 修改 如 下 (student 5.py) : 


class Student (object) : 








def _init__ (self) : 
Self.name = 'xiaozhi' 


def getattr (self, attr) : 
if attr=='score': 
return 95 
当 调 用 不 存在 的 属性 时 (如 score) ，Python 解释 器 会 调用 ”getattr _(self, 'score') 尝 试 获得 属 
性 ， 这 样 就 有 机 会 返回 score 的 值 。 在 交互 模式 下 输入 如 下 : 


>>> stu = Student() 





>>> stu.name 
xiaozhi 

>>> stu.score 
95 


由 输出 结果 看 到 ， 可 以 正确 输出 不 存在 的 属性 的 值 了 。 

注意 ,只 有 在 没有 找到 属性 的 情况 下 才 调 用 _getattr _, 已 有 的 属性 (如 name) 不 会 在 _getattr _ 
中 查找 。 此 外 ， 如 果 所 有 调用 都 会 返回 None (如 stu.abc) ， 就 是 定义 的 _getattr 默认 返回 None。 

5. call 

一 个 对 象 实例 可 以 有 自己 的 属性 和 方法 ， 调 用 实例 的 方法 时 使 用 instance.method() 调 用 。 能 不 
能 直接 在 实例 本 身 调用 呢 ? 答案 是 可 以 。 

任何 类 ， 只 需要 定义 一 个 _call_0 方 法 ， 就 可 以 直接 对 实例 进行 调用 ， 例 如 (student_6.py》: 


class Student (object): 
def init (self, name): 

















self.name = name 


def call (self): 
print (f' 名 称 : {self.name}') 


在 交互 模式 下 输入 如 下 : 


>>> stu = Student ('xiaomeng') 
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>>> stu() 
名 称 : xiaomeng 


由 输出 结果 看 到 ， 可 以 直接 对 实例 进行 调用 并 得 到 结果 。 

_call _0 还 可 以 定义 参数 。 对 实例 进行 直接 调用 就 像 对 一 个 函数 调用 一 样 ， 完 全 可 以 把 对 象 
看 成 函数 ， 把 函数 看 成 对 象 ， 因 为 这 两 者 本 来 就 没有 根本 区 别 。 

如 果 把 对 象 看 成 函数 ， 函 数 本 身 就 可 以 在 运行 期 间 动态 创建 出 来 ， 因 为 类 的 实例 都 是 运行 期 
间 创 建 出 来 的 。 这 样 一 来 ， 就 模糊 了 对 象 和 函数 的 界限 。 

怎么 判断 一 个 变量 是 对 象 还 是 函数 呢 ? 

很 多 时 候 判 断 一 个 对 象 是 否 能 被 调用 可 以 使 用 callable() 函 数 ， 比 如 max 函数 和 上 面 定 义 的 带 
有 .call_(0 的 Student 类 实例 。 输 入 如 下 〈student 6.py) : 


>>> callable(Student('xiaozhi')) 
True 

>>> callable (max) 

True 

>>> callable([1, 2, 3]) 

False 

>>> callable (None) 

False 

>>> callable('a') 

False 


由 操作 结果 看 到 ， 通 过 callable() 函 数 可 以 判断 一 个 对 象 是 否 为 “可 调用 ”对 和 象 。 


8.10 “牛刀 小 试 一 一 出 行 建议 





小 智 今天 想 出 去 ， 但 不 清楚 今天 的 天 气 是 否 适宜 出 行 ， 需 要 一 个 帮 他 提供 建议 的 程序 ， 程 序 
要 求 输入 daytime 和 night， 根 据 可 见 度 和 温度 给 出 出 行 建议 和 使 用 的 交通 工具 ， 需 要 考虑 需求 变 
更 的 可 能 。 

需求 分 析 : 

使 用 本 章 所 学 的 封装 、 继 承 、 多 态 比较 容易 实现 ， 由 父 类 封装 查看 可 见 度 和 查看 温度 的 方法 ， 
子 类 继承 父 类 。 若 有 需要 ， 子 类 可 以 覆盖 父 类 的 方法 ， 做 自己 的 实现 。 子 类 也 可 以 自 定义 方法 。 

定义 天 气 查 找 类 ， 类 中 定义 两 个 方法 ， 一 个 方法 根据 传 入 的 input_daytime 值 返 回 对 应 的 可 见 
度 ; 另 一 个 方法 根据 传 入 的 input_ daytime 值 返 回 对 应 的 温度 〈weather_search.py) 。 


#! /usr/bin/python3 
# =*= COodingyUTE -0 =-*= 





class WeatherSearch (object): 
def _init (self, input daytime): 
self.input daytime = input_daytime 


def seach visibility(self): 
visible leave = 0 
if self.input_ daytime == 'daytime': 
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定义 建议 类 , 该 类 继承 WeatherSearch 类 。 类 中 定义 两 个 方法 , 一 个 覆盖 父 类 的 温度 查找 方法 ， 
具有 传 入 的 input daytime 的 值 ， 返 回 建议 使 用 的 交通 工具 ; 另 一 个 方法 返回 整体 的 建议 
(out advice.py) 。 





程序 调用 如 下 : 





结果 如 下 : 
~ Theveatheris good,suitable forusebike. 
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8.11 调 试 


在 程序 运行 的 任何 时 刻 为 对 象 添加 属性 都 是 合法 的 ， 不 过 应 当 避 免 让 对 象 拥有 相同 的 类 型 却 


有 不 同 的 属性 组 。 
在 init 方法 中 初始 化 对 象 的 全 部 属性 是 一 个 好 习惯 , 可 以 帮助 用 户 更 好 地 管理 类 中 的 属性 和 对 
属性 值 的 更 改 。 


继承 会 给 调试 带 来 新 挑战 ， 因 为 当 你 调用 对 象 的 方法 时 ， 可 能 无 法 知道 调用 的 是 哪 一 个 方法 。 
一 旦 无 法 确认 程序 的 运行 流程 , 最 简单 的 解决 办 法 是 在 适当 位 置 添加 一 个 输出 语句 , 如 在 相关 方法 
的 开头 或 方法 调用 开始 处 等 。 


8.12 ”问题 解答 


(1) 双 下 夯 线 开头 的 实例 变量 一 定 不 能 从 外 部 访问 吗 ? 
答 : 不 是 。 不 能 直接 访问 _score 是 因为 Python 解释 器 对 外 把 _ score 变量 改 成 了 
_Student _score， 所 以 仍然 能 够 通过 Student _score 访问 _ score 变量 ， 例 如 : 
class Student (object) : 
def _init_ (self，name，score) : 


self. name = name 
Self.__score = score 


def info(self) : 
print (f' 学 生 {self. name}; 分 数 : {self. scorel' ) 


stu = Student ('xiaomeng', 95) 

print (f' 分 数 ; {stu._Student score}') 

执行 结果 为 : 

分 数 : 95 

(2) 方法 与 函数 有 什么 区 别 ? 

答 : 在 Python 中 ， 函 数 并 不 依附 于 类 ， 也 不 在 类 中 定义 。 而 方法 依附 于 类 ， 定 义 在 类 中 ， 本 
质 上 还 是 一 个 函数 。 为 便于 区 分 ， 我 们 将 类 中 的 函数 称 为 方法 ， 不 依赖 于 类 的 函数 仍然 称 为 函数 。 

(3) 为 什么 要 使 用 类 ? 

答 : 在 Python 中， 借助 继承 、 多 态 、 封 装 三 大 特性 ,使 用 类 可 以 更 好 地 对 一 类 事物 进行 管理 ， 
可 以 将 具有 相同 功能 或 行为 的 事物 封装 成 一 个 类 , 其 他 具有 相同 特性 的 类 直接 继承 该 类 , 即 可 获得 
父 类 封装 好 的 功能 ,同时 子 类 可 以 覆盖 父 类 的 方法 ， 以 满足 特定 的 功能 需求 。 子 类 也 可 以 扩展 自己 
的 功能 。 使 用 类 可 以 更 好 地 实现 代码 的 复 用 和 扩展 。 
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8.13 温 故 知 新 ， 学 以 致 用 





本 章 主要 讲解 了 类 、 类 的 使 用 、 类 的 特性 等 。 在 本 章 结束 前 让 我 们 回顾 一 下 学 到 的 内 容 。 


(1) 什么 是 类 ? 如 何 使 用 类 ? 

(2) 为 什么 要 有 类 的 构造 方法 ? 使 用 构造 方法 有 什么 好 处 ? 
(3) 类 有 哪些 访问 权限 ? 都 怎么 使 用 ? 

(4) 继承 、 多 态 、 封 装 都 是 怎么 体现 的 ? 

(5) 类 有 哪些 专 有 方法 ? 


思考 并 解决 如 下 问题 : 


(1) 自 定义 一 个 类 ， 在 类 中 定义 一 个 函数 ， 通 过 函数 调用 打印 出 “hello world! ”。 

(2) 定义 一 个 类 ， 使 构造 方法 带 参数 ， 定 义 一 个 实现 求 和 的 基本 函数 ， 调 用 该 类 实现 对 任何 
两 数 求 和 。 

(3) 定义 一 个 类 ， 构 造 函 数 中 设计 私有 变量 ， 定 义 一 个 基本 信息 提取 函数 ， 外 部 通过 对 类 中 
函数 的 调用 更 改 私 有 变量 ， 并 通过 信息 提取 函数 打印 提取 信息 。 

(4) 定义 一 个 Animal 类 ， 类 中 实现 run0 和 eat0 两 个 基本 函数 ， 定 义 两 个 子 类 Cat 和 Dog， 
两 个 子 类 继承 Animal 类 ， 不 做 任何 操作 。 

(5) 定义 一 个 Animal 类 ， 类 中 实现 run0 和 eat0 两 个 基本 函数 ， 定 义 两 个 子 类 Cat 和 Dog， 
两 个 子 类 继承 Animal 类 ， 并 实现 具体 的 run0 和 eat0 函 数 ， 让 这 两 个 函数 在 Cat 和 Dog 类 中 有 Cat 
和 Dog 的 行为 。 

(6) 对 于 题 (5) ， 初 始 化 一 个 Dog 类 对 象 ， 获 取 该 对 象 的 信息 ， 分 别 用 type0 和 isinstance() 
函数 获取 。 

(7) 定义 一 个 类 ， 在 类 中 实现 返回 int 类 型 对 象 的 专 有 方法 。 

(8) 定义 一 个 类 ， 在 类 中 实现 返回 多 种 类 型 对 象 的 专业 方法 ， 如 str、int 等 。 

(9) 将 图 8-2 实现 为 具体 的 类 ， 分 别 为 继承 树 中 的 3 个 层次 添加 不 同 的 方法 ， 例 如 : 


@ 定 义 一 个 Animal 类 ， 用 Animal 的 _init _() 方 法 做 一 些 值 的 初始 化 ， 并 在 Animal 中 封装 一 
个 所 有 动物 都 有 的 动作 行为 的 方法 。 

回 分 别 为 Mammal 和 Bird 定义 一 个 类 , 继承 Animal 类 , 并 定义 一 些 各 自 拥 有 特殊 动作 行为 的 
方法 ， 并 实现 多 态 。 

图 分 别 为 第 3 层 的 4 个 动物 定义 一 个 类 ， 实 现 多 重 继承 和 多 态 ， 并 进行 适当 扩展 。 
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前 面 对 于 程序 运行 过 程 中 出 现 的 不 正常 ， 我 们 要 么 称 之 为 错误 ， 要 么 称 之 为 异常 ， 要 么 说 程 
序 没有 按 预 期 运行 ， 在 本 章 终 于 有 了 一 个 统一 的 称谓 一 一 异常 。 
本 章 将 带领 读者 学 习 如 何 处 理 各 种 异常 ， 以 及 创建 和 自 定 义 异常 。 


9.1 什么 是 异常 


本 节 开始 介绍 之 前 ， 先 看 看 如 下 程序 : 

>>> Print(a) 

Traceback (most recent call last) : 

File "<stdin>", line 1, in <module> 

NameError: name 'a' is not defined 

是 不 是 很 熟悉 ， 这 是 我 们 前 面 经 常 看 到 的 程序 运行 出 现 的 错误 。 

作为 Python 初学 者 ， 在 学 习 Python 编程 的 过 程 中 ， 经 常会 看 到 一 些 报错 信息 ， 使 你 编写 的 程 
序 不 能 如 期 工作 ， 如 我 们 前 面 看 到 过 的 NameError、SyntaxError、TypeError、ValueError 等 ， 这 些 

异常 是 一 个 事件 ， 该 事件 会 在 程序 执行 过 程 中 发 生 ， 影 响 程序 的 正常 执行 。 一 般 情况 下 ， 在 
Python 无 法 正常 处 理 程序 时 就 会 发 生 异常 。 异常 是 Python 的 对 象 ， 表 示 一 个 错误 。 当 Python 脚本 
发 生 异 常 时 ， 我 们 需要 捕获 并 处 理 异常 ， 否 则 程序 会 终止 执行 。 

每 一 个 异常 都 是 一 些 类 的 实例 ， 这 些 实例 可 以 被 引用 ， 并 且 可 以 用 很 多 种 方法 进行 捕捉 ， 使 


得 错误 可 以 被 处 理 ， 而 不 是 让 整个 程序 失败 。 











9.2 ”异常 处 理 


出 现 异 常 怎么 办 呢 ? 

就 如 我 们 使 用 的 工具 出 了 点 小 毛病 ， 我 们 可 以 想 办 法 修理 好 它 。 程 序 也 一 样 ， 前 辈 们 经 过 不 
断 积累 与 思考 ， 创 造 了 不 少 好 方法 处 理 程序 中 的 异常 ， 最 简单 的 是 使 用 try 语句 处 理 。 

try 语句 的 基本 形式 为 try/except。try/except 语句 用 来 检测 try 语句 块 中 的 错误 ， 从 而 让 except 
语句 捕获 异常 信息 并 处 理 。 如果 你 不 想 在 发 生 异 常 时 结束 程序 , 只 需 在 try 语句 块 中 捕获 异常 即 可 。 

捕获 异常 的 语法 如 下 : 


try: 

< 语句 > # 运 行 别 的 代码 

except < 名 字 >: 

< 语句 > # 如 果 在 try 部 分 引发 了 异常 


try 的 工作 原理 是 ， 开 始 一 个 try 语句 后 ，Python 就 在 当前 程序 的 上 下 文中 做 标记 ， 当 出 现 异 
常 时 就 可 以 回 到 做 标记 的 地 方 。 首 先 执行 try 子 句 ， 接 下 来 发 生 什么 依赖 于 执行 时 是 否 出 现 异常 。 

如 果 try 后 的 语句 执行 时 发 生 异 常 ， 程 序 就 跳 回 try 并 执行 except 子 句 。 异 常 处 理 完毕 后 ， 控 
制 流 就 可 以 通过 整个 try 语句 了 【除非 在 处 理 异 常 时 又 引发 新 异常 ) 。 

例如 以 下 示例 所 示 (exp_exception.py) : 


#!/usr/bin/python3 
# -*- coding:UTF-8 -*- 


def exp exception(x,y): 
try: 
a= x/y 
print('a=', a) 
return a 
except Exception: 


Print ( "程序 出 现 异 常 ， 异 常 信息 : 被 除数 为 0') 

exp_exception (2, 0) 

程序 执行 结果 如 下 : 

程序 出 现 异常 ， 异 常 信息 : 被 除数 为 0 

由 执行 结果 看 到 ， 程 序 最 后 执行 的 是 except 子 句 ， 如 果 语 句 正常 ， 应 该 输出 “a=” 的 形式 。 

这 里 你 可 能 会 有 疑问 : 直接 在 做 除法 前 对 y 值 进行 判断 不 就 解决 问题 了 ， 何 必 使 用 try/except 
语句 呢 ? 

在 本 例 中 这 么 做 确实 更 好 一 些 。 如 果 给 程序 加 入 更 多 除法 ， 就 得 给 每 个 除法 语句 加 一 个 判断 
语句 ， 这 样 整 段 代码 看 上 去 就 是 一 堆 类 似 if 的 功能 重复 判断 语句 ， 真 正 有 效 的 代码 没 多 少 。 而 使 
用 try/except 只 需要 一 个 错误 处 理 器 即 可 。 
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如 果 没 有 处 理 异 常 ， 异 常 就 会 被 “传播 ”到 调用 的 函数 中 。 如 果 在 调用 的 函数 中 依然 没有 
处 理 ， 异 常 就 会 继续 “传播 "， 直 到 程序 的 最 顶层 。 也 就 是 可 以 处 理 其 他 人 程序 中 未 处 理 的 
异常 。 





9.3 抛 出 异 稼 


Python 使 用 raise 语句 抛 出 一 个 指定 异常 。 我 们 可 以 使 用 类 (Exception 的 子 类 ) 或 实例 参数 调 
用 raise 语句 引发 异常 。 使 用 类 时 程序 会 自动 创建 实例 。 
例如 : 


>>> raise Exception 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
Exception 
>>> raise NameError('This is NameError') 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
NameError: This is NameError 


由 操作 结果 看 到 ,第 一 个 示例 raise Exception 引发 了 一 个 没有 相关 错误 信息 的 普通 异常 , 第 二 
个 示例 输出 了 一 些 错误 提示 。 
如 果 只 想 知 道 是 否 抛 出 了 异常 ， 并 不 想 处 理 ， 使 用 一 个 简单 的 raise 语句 就 可 以 再 次 把 异常 抛 
出 ， 例 如 : 
>>> try: 
raise NameError('This is NameError') 


except NameError: 
print ('An exception happened!') # 后 面 不 加 raise 


Rn exception happened! # 不 加 raise， 输 出 对 应 字符 就 结束 


>>> try: 
raise NameError('This is NameError') 
except NameError: 
print ('An exception happened!') 


raise # 最 后 加 一 个 raise 


An exception happened! 

Traceback (most recent call last): 
File "<stdin>", line 2, in <module> 

NameError: This is NameError 


由 输出 结果 看 到 ， 使 用 raise 可 以 输出 更 深层 次 的 异常 。 在 使 用 过 程 中 ， 可 以 借助 该 方法 得 到 
更 详尽 的 异常 信息 。 
我 们 前 面 碰 到 的 NameError、SyntaxError、TypeError、ValueError 等 异常 类 称 为 内 建 异 常 类 。 
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在 Python 中 ， 内 建 的 异常 类 有 很 多 ， 可 以 使 用 dir 函数 列 出 异常 类 的 内 容 ， 并 用 在 raise 语句 中 ， 
用 法 如 raise NameError 这 般 。 表 9-1 描述 了 一 些 重要 的 内 建 异 常 类 。 


表 9-1 Python 重要 的 内 建 异 常 类 
































异常 名 称 描述 

Exception 常规 错误 的 基 类 

AttributeError 对 象 没有 这 个 属性 

IOError 输入 /输出 操作 失败 

IndexError 序列 中 没有 此 索引 (index) 
KeyError 映射 中 没有 这 个 键 

NameError 未 声明 /初始 化 对 象 ( 没 有 属性 ) 
SyntaxError Python 语法 错误 

SystemError 一 般 解 释 器 系统 错误 

ValueError 传 入 无 效 的 参数 


9.4 ”捕捉 多 个 异 第 


我 们 在 前 面 讲述 了 处 理 一 个 异常 的 情况 ， 若 涉及 多 个 异常 ， 该 怎么 处 理 呢 ? 
Python 支持 在 一 个 try/except 语句 中 处 理 多 个 异常 ， 语 法 如 下 : 


try: 

< 语句 > # 运 行 别 的 代码 

except < 名 字 1>: 

< 语句 > # 如 果 在 try 部 分 引发 了 namel 异常 
except < 名 字 2>，< 数 据 >: 

< 语句 > # 如 果 引 发 了 name2 异常 ， 获 得 附加 数据 


try 语句 按照 如 下 方式 工作 : 

首先 ， 执 行 ty 子 句 〈 在 关键 字 try 和 关键 字 except 之 间 的 语句 ) 。 如 果 没 有 发 生 异 常 ， 忽 略 
except 子 句 ，try 子 句 执行 后 结束 。 如 果 在 执行 ty 子 句 的 过 程 中 发 生 异 常 ，try 子 句 余下 的 部 分 就 
会 被 忽略 。 如 果 异 常 的 类 型 和 except 之 后 的 名 称 相符 ， 对 应 的 except 子 句 就 会 被 执行 。 最 后 执行 
try 语句 之 后 的 代码 。 如 果 一 个 异常 没有 与 任何 except 匹配 ， 这 个 异常 就 会 传递 到 上 层 的 try 中 。 
一 个 try 语句 可 能 包含 多 个 except 子 句 ， 分 别处 理 不 同 的 异常 ， 但 最 多 只 有 一 个 分 支 会 被 执行 。 

处 理 程序 将 只 针对 对 应 try 子 句 中 的 异常 进行 处 理 ， 而 不 会 处 理 其 他 异常 语句 中 的 异常 ， 例 如 
(mult_exception.py) : 


#!/usr/bin/python3 
# -*- coding:UTF-8 —*— 


def mult exception (x,y): 
try: 
a= x/y 
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b = name 
except ZeroDivisionError: 

print('this is ZeroDivisionError') 
except NameError: 

print('this is NameError') 


mult_exception (2,0) 


执行 结果 如 下 : 


This is ZeroDivisionError 


若 把 a= x/y 注释 掉 或 放 到 b= name 下 面 ， 则 得 到 的 执行 结果 为 : 


This is NameError 


由 执行 结果 看 到 ， 一 个 try 可 包含 多 个 except 子 句 ， 但 子 句 中 只 有 一 个 分 支 会 被 处 理 。 

当然 ， 你 可 能 会 考虑 使 用 if 语句 ， 但 这 样 需要 考虑 是 否 做 了 除法 运算 ， 做 除法 运算 时 是 否 使 
用 了 变量 ， 是 否 可 能 有 等 于 0 的 变量 用 作 被 除数 等 。 需 要 考虑 很 多 种 情况 ， 也 需要 写 很 多 让 语句 
判断 ， 若 不 经 过 严密 思考 和 大 量 测 试 ， 很 难 把 所 有 情况 都 考虑 到 。 此 外 ,让 语句 过 多 会 使 程序 阅读 
起 来 比较 困难 。 抛 出 异常 的 方式 更 加 简单 、 直 观 ， 可 以 清晰 帮助 用 户 定 位 问题 ， 并 且 可 以 自 定义 异 
常 信息 ， 进 一 步 定位 问题 所 在 。 


9.5 ”使 用 一 个 块 捕捉 多 个 异常 


9.4 节 讲 述 了 一 个 try 语句 对 应 多 个 except 子 句 ， 若 需要 一 个 try 对 应 一 个 except 子 句 ， 同 时 
捕捉 一 个 以 上 异常 ， 可 以 实现 吗 ? 我 们 先 看 如 下 示例 (model_exception.py) : 

#!/usr/bin/python3 

# -*- coding:;UTF-8 一 * 一 


def model exception (x,y): 
try: 
b = name 
a= x/y 
except (ZeroDivisionError, NameError, TypeError): 
print('one of ZeroDivisionError or NameError or TypeError happened') 


model_exception(2,0) 

程序 执行 结果 如 下 : 

one of ZeroDivisionError or NameError or TypeError happened 

由 执行 结果 看 到 ， 如 果 需 要 使 用 一 个 块 捕捉 多 个 类 型 的 异常 ， 可 以 将 它们 作为 元 组 列 出 。 使 
用 该 方式 时 ， 遇 到 的 异常 类 型 是 元 组 中 的 任意 一 个 ， 都 会 走 异常 流程 。 

这 么 做 有 什么 好 处 呢 ? 假如 我 们 希望 多 个 except 子 句 输出 同样 的 信息 ， 就 没有 必要 在 几 个 
except 子 句 中 重复 输入 语句 ， 放 到 一 个 异常 块 中 即 可 。 
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9.6 ”捕捉 对 象 





如 果 希 望 在 except 子 句 中 访问 异常 对 象 本 身 ， 也 就 是 看 到 一 个 异常 对 象 真正 的 异常 信息 ， 而 
不 是 输出 自己 定义 的 异常 信息 ， 可 以 使 用 as e 的 形式 ， 我 们 称 之 为 捕捉 对 象 。 示 例如 下 
(model exception_ 1.py) : 


#!/usr/bin/python3 
# -*- coding:UTF-8 一 * 一 


def model exception (x,y): 
try: 
b= name 
a= x/y 
except (ZeroDivisionError, NameError, TypeError) as e: 
Print(e) 


model exception(2,0) 

执行 结果 如 下 : 

name 'name' is not defined 

若 a=x/y 在 前 ， 则 结果 如 下 : 

division by zero 

由 输出 的 结果 可 知 ， 执 行 过 程 中 抛 出 的 异常 被 截获 并 正常 输出 了 相关 异常 信息 ， 并 且 使 用 这 
种 方式 可 以 捕捉 多 个 异常 。 


在 Python 2 中 ， 捕 扣 对 象 的 子 句 写法 是 “Exception,e”， 中 间 使 用 “,” 号 分 隔 ， 而 不 是 as。 
此 处 的 e 也 可 以 使 用 其 他 字母 ， 用 e 意义 比较 明确 ， 取 自 except 的 首 字 母 。 





9.7 全 捕捉 


前 面 我 们 讲述 了 很 多 异常 ， 读 者 可 能 以 为 可 以 捕捉 所 有 异常 ， 其 实 并 非 如 此 。 请 看 如 下 示例 
(model exception 2.py) : 


#!/usr/bin/python3 
# -*- coding:UTF-8 —*— 


def model exception (x,y): 
try: 
a= x/y 
b = name 
except (ZeroDivisionError, NameError, TypeError) as e: 
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print (e) 

model exception(2,'') 

在 该 示例 中 ， 调 用 函数 时 有 一 个 实 参 传 入 的 是 空 值 。 执 行 结果 如 下 : 

unsupported operand type(s) for /: "int' and 'str' 

由 结果 看 到 , 这 里 抛 出 的 信息 并 不 像 我 们 之 前 看 到 的 那样 , 带 有 明显 的 Error 关键 词 或 异常 词 。 
此 处 只 是 告知 不 支持 的 操作 类 型 。 

在 实际 编码 过 程 中 ， 即 使 程序 能 处 理 好 几 种 类 型 的 异常 ， 但 有 一 些 异常 还 是 会 从 我 们 手掌 中 
溜 走 。 上 面 示例 中 的 异常 就 逃 过 了 try/except 语句 的 检查 ， 对 于 这 种 情况 我 们 根本 无 法 预测 会 发 生 
什么 , 也 无 法 提前 做 任何 准备 。 在 这 种 情况 下 , 与 其 使 用 不 是 捕捉 异常 的 try/except 语句 隐藏 异常 ， 
不 如 让 程序 立即 前 溃 。 

如 果 要 处 理 这 种 异常 ， 该 怎么 办 呢 ? 先 看 如 下 示例 (model_exception 3.py) : 


#!/usr/bin/python3 
# -*- coding:UTF-8 一 * 一 


def model exception (x,y): 
try: 
b = name 
a= x/y 
except: 
Print('Error happened') 


model exception(2,'') 

执行 结果 如 下 : 

Error happened 

由 程序 和 执行 结果 看 到 ， 可 以 在 except 子 句 中 忽略 所 有 异常 类 ， 从 而 让 程序 输出 自己 定义 的 

当然 ， 这 里 只 给 出 了 一 种 可 参考 的 解决 方式 。 从 实用 性 方面 讲 ， 不 建议 这 么 做 ， 因 为 这 样 捕 
捉 异 常 非常 危险 , 会 隐藏 所 有 没有 预先 想到 的 错误 。 建议 使 用 抛 出 异常 的 方式 处 理 , 或 者 对 异常 对 
象 。 进 行 一 些 检查 。 


9.8 ”异常 中 的 else 


如 果 程 序 执行 完 异常 还 需要 做 其 他 事情 ， 怎 么 办 呢 ? 
异常 为 我 们 提供 了 try...except..else 语句 实现 该 功能 ， 语 法 如 下 : 
try: 

< 语句 > # 运 行 别 的 代码 

except < 名 字 >: 

< 语句 > # 如 果 在 try 部 分 引发 了 异常 1 





except < 名 字 >，< 数 据 >: 


< 语句 > # 如 果 引 发 了 异常 2， 获 得 附加 数据 
else: 
< 语句 > # 如 果 没 有 发 生 异 常 


如 果 在 try 子 句 执行 时 没有 发 生 异 常 ， 就 会 执行 else 语句 后 的 语句 (如 果 有 else) 。 使 用 else 
子 句 比 把 所 有 语句 都 放 在 try 子 句 里 面 更 好 ， 这 样 可 以 避免 一 些 意 想 不 到 而 except 又 没有 捕获 的 
异常 。 

例如 (model exception 4.py) : 


#!/usr/bin/python3 
# -*- coding:UTF-8 -*— 


def model exception (x,y): 
try: 
a= x/y 
except: 
Print('Error happened') 
else: 
print('It went as expected') 


model_ exception(2,1) 
执行 结果 如 下 : 


It went as expected 


由 执行 结果 看 到 ， 没 有 发 生 异常 时 ， 会 执行 else 子 句 的 流程 。 
综 上 所 述 ， 当 程序 没有 发 生 异 常 时 ， 通 过 添加 一 个 else 子 句 做 一 些 事情 (比如 输出 一 些 信息 》 
很 有 用 ， 可 以 帮助 我 们 更 好 地 判断 程序 的 执行 情况 。 


9.9 自 定 义 异 党 


尽管 内 建 异常 类 包括 大 部 分 异常 ， 而 且 可 满足 很 多 要 求 ， 但 有 时 还 是 要 创建 自己 的 异常 类 。 比 如 
需要 精确 知道 问题 的 根源 ， 就 需要 使 用 自 定义 异常 精确 定位 问题 。 可 以 通过 创建 一 个 新 exception 类 拥 
有 自己 的 异常 。 异 常 应 该 继承 自 Exception 类 ， 可 以 直接 继承 ， 也 可 以 间接 继承 。 

因为 错误 就 是 类 ， 捕 获 一 个 错误 就 是 捕获 该 类 的 一 个 实例 ， 因 此 错误 并 不 是 凭空 产生 的 ， 而 
是 由 一 些 不 合理 的 部 分 导致 的 。Python 的 内 置 函数 会 抛 出 很 多 类 型 的 错误 ， 我 们 自己 编写 的 函数 
也 可 以 抛 出 错误 。 如 果 要 抛 出 错误 ,那么 可 以 根据 需要 定义 一 个 错误 的 类 ， 选 择 好 继承 关系 ， 然 后 
用 raise 语句 抛 出 一 个 错误 的 实例 。 

例如 (my_errorpy) : 


#!/usr/bin/python3 
codingiUre 0 一 “一 


class MyError (Exception): 
def _init (self): 
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pass 


def _ str_(self): 


return "this is self define error' 


def my error test(): 
try: 
raise MYError () 
except MyError as el: 
print('exception info:', e) 


my_error test() 

执行 结果 如 下 : 

exception info: this is self define error 

由 程序 和 执行 结果 看 到 ， 程 序 正确 执行 了 自 定义 的 异常 ， 并 且 需 要 继承 Exception 类 。 

这 只 是 一 个 简单 的 示例 ， 还 有 不 少 细节 需要 琢磨 ， 此 处 不 做 深入 探讨 ， 有 兴趣 的 读者 可 以 查 
阅 相 关 资 料 进行 实践 。 








异常 最 好 以 Error 结尾 ， 一 方面 贴近 标准 异常 的 命名 ， 男 一 方面 便于 见 名 知 意 。 





9.10 finally 子 名 


Python 中 的 finally 子 句 需要 和 try 子 句 一 起 使 用 ， 组 成 try/finally 的 语句 形式 ，try/finally 语句 
无 论 发 生 异 常 与 否 都 将 执行 最 后 的 代码 。 
例如 〈use_finally.py) : 


#!/usr/bin/python3 
# -*- coding:UTF-8 —*— 


def use finally(x,y): 
try: 
a= x/y 
finally: 
print('No matter what happened,I will show in front of you') 


use_finally (2,0) 
执行 结果 为 : 


No matter what happened,I will show in front of you 
Traceback (most recent call last): 
File "D:/python/workspace/exceptiontest.py", line 65, in <module> 
use finally(2,0) 
File "D:/python/workspace/exceptiontest.py", line 61, in use finally 
a= x/y 
ZeroDivisionError: division by zero 


由 执行 结果 看 到 ，finally 子 句 被 执行 了 ， 无 论 try 子 句 中 是 否 发 生 异 常 ，finally 都 会 被 执行 。 
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这 里 我 们 有 一 个 疑问 ,虽然 执行 了 finally 子 句 ,但 是 最 后 还 是 抛 出 异常 了 , 是否 可 以 使 用 except 
截获 异常 呢 ? 

可 以 使 用 except 截获 异常 。try、except、else 和 finally 可 以 组 合 使 用 ,但 要 记得 else 在 except 
之 后 ，finally 在 except 和 else 之 后 。 对 于 上 面 的 示例 ， 可 以 更 改 如 下 (use finally_1.py): 

#!/usr/bin/python3 

# -*~- coding:UTF-8 -*— 


def use finally(x,y): 
try: 
a= x/y 
except ZeroDivisionError: 
print('Some bad thing happened:division by zero') 
finally: 
print('No matter what happened,I will show in front of you') 


use finally(2,0) 
执行 结果 如 下 : 


Some bad thing happened:division by zero 
No matter what happened,I will show in front of you 


由 执行 结果 看 到 ， 先 执行 了 except 子 句 的 输出 语句 ， 后面 跟 着 执行 了 finally 子 句 的 输出 语句 。 
如 果 再 添加 else 子 句 ， 当 程序 正常 运行 时 会 先 执行 else 子 句 ， 然 后 执行 finally 子 句 。 在 有 finally 
的 异常 处 理 程序 中 ，finally 中 的 子 句 一 定 是 最 后 执行 的 。finally 子 句 在 关闭 文件 或 数据 库 连 接 时 非 
常 有 用 (文件 操作 和 数据 库 操作 后 面 会 具体 讲解 〉。 





在 Python 2.5 之 前 的 版 本 中 ，finally 需要 独立 使 用 ， 不 能 与 try 语句 配合 。 在 Python 2.5 之 
后 才 支 持 这 些 语句 的 组 合 使 用 。 





9.11 异常 和 函数 


异常 和 函数 能 够 很 自然 地 一 起 工作 。 如 果 异 常 在 函数 内 引发 而 不 被 处 理 ， 就 会 传播 至 函数 调 
用 的 地 方 。 如 果 蜡 常 在 函数 调用 的 地 方 也 没有 被 处 理 ， 就 会 继续 传播 ,一直 到达 主 程序 。 如 果 在 主 
程序 也 没有 做 异常 处 理 ， 异 常 就 会 被 Python 解释 器 捕获 ， 输 出 一 个 错误 信息 ， 然 后 退出 程序 。 

例如 〈division_ fun.py) : 








#!/usr/bin/python3 

# ~*~ coding:UTF-8 ~*— 

def division fun(x, y): 
return x / int(y) 


def exp_fun(x, y): 
return division fun(x, y) * 10 
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def main (x,y): 
exp_fun (x, y) 


main(2,0) 


执行 结果 如 下 : 


Traceback (most recent call last): 
File "D:/python/workspace/exceptiontest.py", line 14, in <module> 
main (2,0) 
File "D:/python/workspace/exceptiontest.py", line 12, in main 
exp_fun(x, y) 
File "D:/python/workspace/exceptiontest.py", line 9, in exp_fun 
return division fun(x, y) * 10 
File "D:/python/workspace/exceptiontest.py", line 6, in division fun 
return x / int(y) 
ZeroDivisionError: division by zero 


由 执行 结果 看 到 , division_fun 函数 中 产生 的 异常 通过 division_fun 和 exp_fun 函数 传播 ,exp_fun 
中 的 异常 通过 exp_fun 和 main 函数 传播 ， 传 递 到 函数 调用 处 由 解释 器 处 理 ， 最 终 抛 出 堆栈 的 异常 


异常 信息 是 以 堆栈 的 形式 被 抛 出 的 ， 因 而 是 从 下 往 上 查看 的 。 所 谓 堆 栈 ， 就 是 最 先 被 发 现 


的 蜡 常 信息 最 后 被 输出 (就 像 子 弹 入 弹 夹 和 出 弹 夹 一 样 ), 也 称 作 先 进 后 出 ( First In Last Out， 
FILO). 





9.12 “牛刀 小 试 一 一 正常 数 和 异常 数 


做 如 下 实现 : 

对 给 定 的 数组 ， 前 后 两 个 数组 相 除 ， 若 被 除数 为 0， 则 通过 自 定义 异常 打印 出 异常 信息 ， 并 加 
入 异常 数 数组 中 , 若 被 除数 不 为 0， 则 为 正常 数 ， 加 入 正常 数 数组 中 。 最 后 打印 出 正常 数 和 异常 数 。 

(1) for 循环 取得 前 后 两 个 数 。 

(2) 对 除法 做 异常 捕获 。 

(3) 定义 正常 数 数组 ， 走 正常 逻辑 通过 的 数组 加 入 正常 数 数组 中 。 定 义 异 常数 数组 ， 被 异常 
捕获 后 ， 调 用 自 定义 异常 ， 返 回 异 常数 值 和 异常 信息 。 

代码 实现 如 下 〈exception num.py) : 





# -*- coding:UTF-8 —*— 


num list = [5,0,73,0,16] 


class ExceptionNum(object): 


运行 示例 代码 得 到 的 结果 如 下 : 
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9.13 “bug 的 由 来 


在 编程 的 过 程 中 ， 当 程序 出 现 问题 时 ， 我 们 就 会 说 出 bug 了 。bug 到 底 是 什么 意思 呢 ? 为 什么 
称 之 为 bug? 

bug 一 词 原本 的 意思 是 “臭虫 子 ” 或 “虫子 ”， 不 过 现在 我 们 更 多 将 其 认为 是 计算 机 系统 或 程 
序 中 隐藏 的 一 些 未 被 发 现 的 缺陷 或 漏洞 。 

在 20 世纪 40 年 代 ， 电 子 计 算 机 非常 庞大 ， 数 量 也 非常 少 ， 主 要 用 于 军事 方面 。1944 年 制造 
完成 的 Mark 1、1946 年 2 月 开始 运行 的 ENIAC 和 1947 年 完成 的 Mark II 是 赫赫 有 名 的 几 台 计算 机 。 
Mark I 是 由 哈佛 大 学 的 Howard Aiken 教授 设计 的 ， 由 IBM 公司 制造 ，Mark II 是 由 美国 海军 出 资 
制造 的 ， 与 使 用 电子 管制 造 的 ENIAC 不 同 ，Mark I 和 Mark II 主要 使 用 开关 和 继电器 制造 。 另 外 ， 
MarkI 和 Mark II 都 是 从 纸 带 或 磁带 上 读 取 指令 并 执行 ， 因 此 不 属于 从 内 存 读 取 和 执行 指令 的 存储 
程序 计算 机 (stored-program computer) 。 

1947 年 9 月 9 日 ，Mark II 计算 机 在 测试 时 突然 发 生 了 故障 ， 经 过 几 个 小 时 的 检查 ， 工 作 人 员 
发 现 一 只 飞 蛾 被 打 死 在 面板 F 的 第 70 号 继电器 中 ， 把 这 个 飞 蛾 取出 后 ， 机 器 便 恢 复 了 正常 。 当 时 
为 Mark II 计算 机 工作 的 著名 女 科 学 家 Grace Hopper 将 这 只 飞 蛾 粘贴 在 了 当天 的 工作 手册 中 , 并 在 

上 面 加 了 一 行 注 释 First actual case of bug being found， 当 时 的 时 间 是 15:45。 随 着 这 个 故事 广 为 流 
传 ， 使 用 bug 一 词 指 代 计算 机 错误 的 人 越 来 越 多 ， 并 把 Grace Hopper 登记 的 那 上 只 飞 蛾 看 作 计算 机 
历史 上 第 一 个 被 记录 在 文档 中 的 bug。 


9.14 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲解 了 异常 处 理 和 自 定义 异常 ， 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 


(1) 异常 一 般 怎么 处 理 ? 

(2) 捕捉 异常 有 哪些 方式 ? 

(3) 如 何 自 定义 异常 ? 

尝试 思考 并 解决 如 下 问题 : 

(1) 写 一 段 代 码 ， 抛 出 一 个 Python 内 建 异常 。 
(2) 写 一 段 代码 ， 使 其 能 抛 出 多 个 异常 。 

(3) 抛 出 异常 ， 并 做 异常 处 理 。 

(4) 做 异常 的 全 捕捉 。 

(5) 在 异常 代码 中 使 用 else。 

(6) 在 异常 代码 中 使 用 finally。 

(7) 自 定义 异常 。 

(8) 自己 设计 一 段 代码 ， 使 该 程序 中 包含 : 
@ 自 定义 异常 ， 加 多 个 异常 和 异常 处 理 方式 ，@else 语句 ，@finally 语句 。 
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小 程序 资源 二 维 码 








扫 码 看 视频 





第 10 


期 和 时 间 


在 Python 中 ， 日 期 和 时 间 的 应 用 非常 普遍 。 在 实际 应 用 中 ， 大 部 分 数据 的 记录 和 日 志 的 处 理 
都 需要 使 用 时 间 。 本 章 将 具体 讲解 Python 中 日 期 和 时 间 的 使 用 。 


10.1 日 期 和 时 间 


在 代码 中 ， 我 们 常常 需要 与 时 间 打 交道 。 在 Python 中 ， 与 时 间 处 理 有 关 的 模块 包括 time、 
datetime 以 及 calendar。 

在 Python 中 ， 通 常用 时 间 戳 、 格 式 化 的 时 间 字 符 串 和 元 组 3 种 方式 表示 时 间 。 下 面 分 别 进行 
讲解 。 


10.1.1 时 间 惟 
通常 ， 时 间 戳 (timestamp) 表示 从 1970 年 1 月 1 日 00 时 00 分 00 秒 开始 按 秒 计算 的 偏 移 量 ， 

也 就 是 从 1970 年 01 月 01 日 00 时 00 分 00 秒 (北京 时 间 1970 年 01 月 01 日 08 时 00 分 00 秒 ) 起 
到 现在 的 总 毫秒 数 。 

时 间 戳 是 一 个 经 加 密 后 形成 的 凭证 文档， 包括 3 部 分 : 

(1) 需 加 时 间 戳 的 文件 的 摘要 (digest〉。 

(2) DTS 收 到 文件 的 日 期 和 时 间 。 

(3) DTS 的 数字 签名 。 

一 般 来 说 , 时 间 惟 产生 的 过 程 为 : 用 户 首先 将 需要 加 时 间 戳 的 文件 用 Hash 编码 加 密 形 成 摘要 ， 
然后 将 该 摘要 发 送 到 DTS，DTS 加 入 收 到 文件 摘要 的 日 期 和 时 间 信息 后 再 对 该 文件 加 密 〈 数 字 签 
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名 ) ， 最 后 送 回 用 户 。 
书面 签署 文件 的 时 间 是 由 签署 人 自己 写 上 的 , 而 数字 时 间 戳 是 由 认证 单位 DTS 添加 的 ,以 DTS 
收 到 文件 的 时 间 为 依据 。 


提 ” 示 





Python 3.7 中 支持 的 最 大 时 间 戳 为 32535244799 (3001-01-01 15:59:59 )。 


10.1.2 ”时 间 格 式 化 符号 


在 Python 中 ,一般 用 表 10-1 所 示 的 格式 化 符号 对 时 间 进 行 格式 化 。 


表 10-1 Python 格式 化 符号 

8 式 | 信和 
%a 本 地 简化 星期 名 称 
%A 本 地 完整 星期 名 称 
%b 本 地 简化 月 份 名 称 
%B 本 地 完整 月 份 名 称 

%c 本 地 相应 的 日 期 和 时 间 表 示 








%d 一 个 月 中 的 第 几 天 (01~31) 

%H 一 天 中 的 第 几 个 小 时 24 小 时 制 ，00~23) 
%l 第 几 个 小 时 (12 小 时 制 ，01~12) 

%i 一 年 中 的 第 儿 天 (001~366) 





%m 月 份 (01~12) 
%M 分 钟 数 〔00~59) 











%p 本 地 AM 或 PM 的 对 应 值 1 

%S 秒 (0-~61) 2 

%U 一 年 中 的 星期 数 〈 取 值 00~53， 星 期 天 为 一 星期 的 开始 ) ， 第 一 个 星期 天 之 前 的 所 有 天 数 都 | 3 
放 在 第 0 周 

Ww 一 个 星期 中 的 第 几 天 0~6，0 是 星期 天 ) 3 





%W 和 %U 基本 相同 ， 不 同 的 是 %W 以 星期 一 为 一 个 星期 的 开始 
Wx 本 地 相应 日 期 

%X 本 地 相应 时 间 

%y 去 掉 世 纪 的 年 份 00~99) 

%Y 完整 的 年 份 

%Z 时 区 的 名 字 〔 如 果 不 存 在 为 空 字符 ) 

%% % 字 符 


下 面 介 绍 表 10-1 备注 中 3 个 数字 的 含义 。 


1: %p 只 有 与 %I 配合 使 用 才 有 效果 。 
2: 文档 中 强调 确实 是 0~61， 而 不 是 59， 闽 年 秒 占 两 秒 。 
3: 当 使 用 strptime() 函 数 时 ， 只 有 这 一 年 的 周 数 和 天 数 确 定时 %U 和 %w 才 会 被 计算 。 
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这 里 通过 表格 列 出 这 些 格式 化 符号 ， 读 者 可 以 大 概 了 解 一 下 ， 有 具体 的 使 用 会 在 后 面 慢 慢 渗入 。 


10.1.3 struct_ time 元 组 


struct time 元 组 共有 9 个 元 素 : 年 、 月 、 日 、 时 、 分 、 秒 、 一 年 中 第 几 周 、 一 年 中 第 几 天 、 是 
和 否 为 夏令 时 。 

Python 函数 用 一 个 元 组 装 起 来 的 9 个 数字 处 理 时 间 ， 也 被 称 作 struct time 元 组 。 表 10-2 列 出 
了 这 种 结构 的 属性 。 


表 10-2 ”Python 的 时 间 元 组 














序号 属性 字段 值 

0 tm_year 4 位 数 年 如 2008 

1 tm_mon 月 1~12 

2 tm mday 日 1~31 

3 tm_hour 小 时 0~23 

4 tm_min 分 钟 0~59 

5 tm _sec 秒 0~61 (60 或 61 是 闲 秒 ) 

6 tm_wday 一 周 的 第 几 日 0~6(0 是 周一 ) 

tm_yday 一 年 的 第 几 日 1~366 〈 儒 略 历 ) 

8 tm_isdst 夏令 时 -1、0、1、-1 是 决定 是 否 为 夏令 时 的 旗帜 


10.2 time 模块 


前 面 我 们 讲述 了 时 间 的 基本 概念 ， 本 节 将 具体 讲述 time 模块 中 的 一 些 常用 函数 。time 模块 的 
内 置 函数 有 做 时 间 处 理 的 ， 也 有 转换 时 间 格 式 的 。 


10.2.1 time() 函 数 


time() 函 数 用 于 返回 当前 时 间 的 时 间 戳 (1970 年 01 月 01 日 08 时 00 分 00 秒 到 现在 的 浮 点 秒 
数 ) 。 
time() 函 数 的 语法 如 下 : 





time.time() 

此 语法 中 第 一 个 time 指 的 是 time 模块 ， 该 函数 不 需要 传递 参数 。 
time 函数 返回 当前 时 间 的 时 间 戳 。 

该 函数 使 用 示例 如 下 (time_use.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 —*— 
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import time 

print (f' 当前 时 间 的 时 间 截 : {time.time () }') 
执行 结果 为 : 

当前 时 间 的 时 间 戳 : 1524300547.9319217 


10.2.2 localtime([secs]) 函 数 


localtime0 函 数 的 作用 是 格式 化 时 间 戳 为 本 地 时 间 。 如 果 secs 参数 未 输入 ， 就 以 当前 时 间 为 
转换 标准 。 

localtime0 函 数 的 语法 如 下 : 

time.localtime([secs]) 

此 语法 中 time 指 的 是 time 模块 ，secs 指 转换 为 time.struct_ time 类 型 的 对 象 的 秒 数 。 

该 函数 没有 任何 返回 值 。 

该 函数 使 用 示例 如 下 (local_time_use.py)》: 


import time 





print (f'time.localtime (): {time.localtime()}') 
执行 结果 为 : 


time.localtime() : time.struct time(tm year=2018, tm mon=3, tm mday=11, tm hour=16, 
tm min=35, tm _ sec=42, tm wday=6, tm yday=269, tm isdst=0) 


10.2.3 gmtime([secs]) 函 数 


gmtime() 函 数 用 于 将 一 个 时 间 戳 转换 为 UTC 时 区 (0 时 区 ) 的 struct_time， 可 选 的 参数 secs 
表示 从 1970-1-1 到 现在 的 秒 数 。gmtime() 函 数 的 默认 值 为 time.time()， 函 数 返回 time.struct_time 类 
型 的 对 象 〈struct_time 是 在 time 模块 中 定义 的 表示 时 间 的 对 象 ) 。 

gmtime() 函 数 的 语法 如 下 : 





time.gmtime([secs]) 

此 语法 中 time 指 的 是 time 模块 ，secs 指 转换 为 time.struct time 类 型 的 对 象 的 秒 数 。 
该 函数 没有 任何 返回 值 。 

该 函数 使 用 示例 如 下 (gm time.py) : 


import time 





print (f£'time. gmtime () : {time. gmtime () } 7) 
执行 结果 为 : 


time .gmtime () : time.struct time (tm year=2018, tm mon=3, tm mday=11, tm hour=8, tm min=36, 
tm sec=27, tm wday=6, tm yday=70, tm isdst=0) 
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10.2.4 mktime(t) 函 数 


返回 





mktime(0) 函 数 用 于 执行 与 gmtime()、localtime() 相 反 的 操作 ， 接 收 struct time 对 象 作 为 参数 ， 
用 秒 数 表 示 时 间 的 浮 点 数 。 如 果 输 入 的 值 不 是 合法 时 间 , 就 会 触发 OverflowError 或 ValueError。 
mktime() 函 数 的 语法 如 下 : 

time.mktime(t) 

此 语法 中 time 指 的 是 time 模块 ，t 指 结构 化 的 时 间或 完整 的 9 位 元 组 元 素 。 

返回 用 秒 数 表 示 时 间 的 浮 点 数 。 

该 函数 使 用 示例 如 下 (mk_time.py) : 


import time 





t = (2016, 9, 25, 17, 35, 38, 6, 48, 0) 
Print (f'time.mktime (t):{time.mktime(t)}') 


执行 结果 为 : 


time.mktime (t) : 1474796138.000000 


10.2.5 _ asctime([t) 函 数 


asctime() 函 数 用 于 接收 时 间 元 组 并 返回 一 个 可 读 的 长 度 为 24 个 字符 的 字符 串 。 
asctime() 函 数 的 语法 如 下 : 


time.asctime([t]) 


此 语法 中 time 指 的 是 time 模块 ，t 指 完整 的 9 位 元 组 元 素 或 通过 函数 gmtime()、 localtime() 


返回 的 时 间 值 。 





返回 一 个 可 读 的 形式 为 Sun Sep 25 09:09:37 2016 (2016 年 09 月 25 日 周 日 9 时 09 分 37 秒 ) 


的 24 个 字符 的 字符 串 。 


10. 


该 函数 使 用 示例 如 下 〈asc_time.py) : 


import time 


t = time.localtime () 
Print (f'time.asctime (t):{time.asctime (t)}') 


执行 结果 为 : 
time.asctime(t): Sun Mar 11 16:42:12 2018 


2.6 ”ctime([secs]) 函 数 


ctime() 函 数 用 于 把 一 个 时 间 戳 〈 按 秒 计算 的 浮 点 数 ) 转化 为 time.asctime() 的 形式 。 如 果 未 指定 
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参数 secs 或 参数 为 None ， 就 会 默认 将 time.time() 作 为 参数 。ctime 的 作用 相当 于 
asctime(localtime(secs))。 


ctimeO) 函 数 的 语法 如 下 : 

time.ctime([secs]) 

此 语法 中 time 指 的 是 time 模块 ，secs 指 要 转换 为 字符 串 时 间 的 秒 数 。 
该 函数 没有 任何 返回 值 。 

该 函数 使 用 示例 如 下 〈c_time.py) : 

import time 

print (f'time.ctime ():{time.ctime()}') 

执行 结果 为 : 


time.ctime() : Sun Mar 11 16:43:14 2018 


10.2.7 sleep(secs) 函 数 


sleep() 函 数 用 于 推迟 调用 线程 的 运行 ， 可 通过 参数 secs 指定 进程 挂 起 的 时 间 。 
sleep0 函 数 的 语法 如 下 : 


time.sleep(secs) 


此 语法 中 time 指 的 是 time 模块 ，secs 指 推迟 执行 的 秒 数 。 
该 函数 没有 返回 值 。 
该 函数 使 用 示例 如 下 〈time_sleep.py) : 


import time 





print (f'Start : {time.ctime()}') 
time.sleep (5) 
print (f'End : {time.ctime()}') 


执行 结果 为 : 


Start : Sun Mar 11 16:44:36 2018 
End : Sun Mar 11 16:44:41 2018 


由 执行 结果 看 到 ， 输 出 的 时 间 相 隔 了 5 秒 。 


10.2.8 clock() 函 数 


clock0 函 数 用 于 以 浮 点 数 计算 的 秒 数 返回 当前 CPU 时 间 ， 用 来 衡量 不 同 程序 的 耗 时 ， 比 
time.time() 更 有 用 。 该 函数 在 不 同系 统 上 的 含义 不 同 。 在 UNIX 系统 中 ， 返 回 的 是 “进程 时 间 ”， 
是 用 秒表 示 的 浮 点 数 〈 时 间 惟 ) ; 在 Windows 系统 中 ,第 一 次 调用 返回 的 是 进程 运行 的 实际 时 间 ， 
第 二 次 之 后 的 调用 返回 的 是 自 第 一 次 调用 后 到 现在 的 运行 时 间 。 
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clock0 函 数 的 语法 如 下 : 

time.clock() 

此 语法 中 time 指 的 是 time 模块 ， 该 函数 不 需要 参数 。 该 函数 有 两 个 功能 : 
(1) 在 第 一 次 调用 时 ， 返 回程 序 运 行 的 实际 时 间 。 

(2) 第 二 次 之 后 的 调用 ， 返 回 自 第 一 次 调用 后 到 这 次 调用 的 时 间 间 隔 。 


在 Win32 系统 中 ，clock() 函 数 返 回 的 是 真实 时 间 (wall time) ， 而 在 UNIX/Linux 系统 中 返 
的 是 CPU 时 间 。 
该 函数 使 用 示例 如 下 (time_clock.py) : 


import time 





加 











def procedure () : 
time .sleep (2) 


# measure process time 

tl = time.clock() 

procedure() 

print (f'seconds process time : {(time.clock() - t1)}') 


# measure wall time 

t2 = time.time() 

procedure() 

print (f'seconds wall time : {(time.time() - t2)}') 


执行 结果 为 : 


seconds process time : 1.9991468375899508 
seconds wall time : 2.0001144409179688 


此 处 的 执行 结果 会 因 计算 机 的 不 同 而 有 所 差异 〈 精 度 存在 误差 ) 。 


10.2.9 strftime(format[, 4]) 函 数 





strftime() 函 数 用 于 接收 时 间 元 组 ， 并 返回 以 可 读 字符 串 表 示 的 当地 时 间 ， 格 式 由 参数 format 
决定 。 

strftime() 函 数 的 语法 如 下 : 

time.strftime(format[, t]) 


此 语法 中 time 指 的 是 time 模块 ，format 指 格式 化 字符 串 ，t 指 可 选 的 参数 ， 是 一 个 struct_time 
对 象 。 

返回 以 可 读 字 符 串 表示 的 当地 时 间 。 

该 函数 使 用 示例 如 下 (strf_time.py》: 


import time 





t= (2018, 3, 11, 16, 50, 38, 6, 48, 0) 
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七 = time.mktime(t) 
Print (time.strftime('%b %d %Y %H:%M:%S', 


执行 结果 为 : 


Mar 11 2018 08:50:38 


time.gmtime(t))) 


10.2.10 ”strptime(string[, format]) 函 数 


strptime() 函 数 用 于 根据 指定 的 格式 把 一 个 时 间 字符 串 解析 为 时 间 元 组 。 


strptime() 函 数 的 语法 如 下 : 


time.strptime(string[, format]) 


此 语法 中 time 指 的 是 time 模块 ，string 指 时 间 字 符 串 ，format 指 格式 化 字符 串 。 
返回 struct_time 对象。 
该 函数 使 用 示例 如 下 〈strp_time.py) : 





import time 


struct time = time.strptime ("11 Mar 18", "%d %b %y") 


Print (f'returned tuple: 


执行 结果 为 : 


returned tuple: 


{struct time}') 


tm _sec=0, tm wday=6, tm yday=70, tm isdst=-1) 


10.2.11 三 种 时 间 格 式 转化 


我 们 前 面 提 到 ， 


如 图 10-1 和 10-2 所 示 。 
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asctime De ctime 
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time. struct time (tm year=2018, tm mon=3, tm mday=11, tm hour=0, tm min=0, 


Python 中 有 3 种 表示 时 间 的 格式 。 这 3 种 时 间 格 式 可 以 相互 转化 ， 转 化 方式 





struct time 











Timestamp 











图 10-1 时 间 格 式 转化 1 


10.3 datetime 模块 


datetime 是 date 与 time 的 结 


合体 ， 包 括 date 与 time 的 所 有 信息 。datetime 的 功能 


图 10-2 时间 格式 转化 2 


强大 ， 支 持 
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0001 年 到 9999 年 。 





datetime 模块 定义 了 两 个 常量 : datetime.MINYEAR 和 datetime.MAXYEAR。 这 两 个 常量 分 别 


表示 datetime 所 能 表示 的 最 小 、 最 大 年 份 。 其 中 ，MINYEAR = 1，MAXYEAR = 9999。 


datetime 模块 定义 了 以 下 5 个 类 。 

datetime.date: 表示 日 期 的 类 。 常 用 的 属性 有 year、month、day。 

datetime.time: 表示 时 间 的 类 。 常 用 的 属性 有 hour、minute、second、microsecond。 
datetime.datetime: 表示 日 期 时 间 。 

datetime.timedelta: 表示 时 间 间 隔 ， 即 两 个 时 间 点 之 间 的 长 度 。 

datetime.tzinfo: 与 时 区 有 关 的 信息 。 

其 中 ，datetime.datetime 类 的 应 用 最 为 普遍 。 下 面 对 该 类 进行 一 些 详细 讲解 。 
datetime.datetime 类 中 有 以 下 方法 。 


1.today() 
today() 方 法 的 语法 如 下 : 
datetime.datetime.today() 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 。 
返回 一 个 表示 当前 本 地 时 间 的 datetime 对 象 。 
该 方法 使 用 示例 如 下 〈today time.py) : 


import datetime 





Print (f'today is:{datetime.datetime.today()}') 
执行 结果 为 : 

today is: 2018-03-11 16:54:20.929875 

2. now([tz]) 

now() 方 法 的 语法 如 下 : 
datetime.datetime.now([tz]) 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 ， 如 果 提 供 了 参数 tz， 就 获取 tz 参数 所 


指 时 区 的 本 地 时 间 。 





返回 一 个 datetime 对 象 。 
该 方法 使 用 示例 如 下 Cnow_time.py) : 


import datetime 
print (f'now is:{datetime.datetime.now()}') 
执行 结果 为 : 


now is: 2018-03-11 16:55:23.823472 


第 10 章 “日 期 和 和 时间 


| 


219 





3. utcnow() 
utcnow() 方 法 的 语法 如 下 : 
datetime.datetime.utcnow() 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 。 
返回 一 个 当前 utc 时 间 的 datetime 对 象 。 
该 方法 使 用 示例 如 下 (utc_now _time.py): 


import datetime 





print (f'utcnow is:{datetime.datetime.utcnow()}') 
执行 结果 为 : 

utcnow is: 2018-03-11 08:56:42.224956 

4. fromtimestamp(timestampl, tz]) 

根据 时 间 戳 创建 一 个 datetime 对 象 。 
fromtimestamp() 方 法 的 语法 如 下 : 
datetime.datetime.fromtimestamp(timestamp[, tz]) 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 ， 参 数 tz 指定 时 区 信息 。 
返回 一 个 datetime 对 象 。 
该 方法 使 用 示例 如 下 (time_stamp.py) : 


import datetime，time 





print (f'fromtimestamp is:fdatetime.datetime.fromtimestamp(time.time())} 7) 
执行 结果 为 : 

fromtimestamp is: 2018-03-11 16:58:10.739020 

5. utcfromtimestamp(timestamp) 

根据 时 间 戳 创建 一 个 datetime 对 象 。 

utcfromtimestamp() 方 法 的 语法 如 下 : 
datetime.datetime.utcfromtimestamp(timestamp) 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 ，timestamp 指 时 间 戳 。 
返回 一 个 datetime 对 象 。 
该 方法 使 用 示例 如 下 〈utc_time_stamp.py) : 


import datetime, time 





print (frutcfromtimestamp is:{datetime.datetime.utcfromtimestamp(time.time())}') 
执行 结果 为 : 


utcfromtimestamp is: 2018-03-11 08:59:15.798741 
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6. strptime(date_string, format) 


将 格式 字符 串 转换 为 datetime 对 象 。 
strptime() 方 法 的 语法 如 下 : 





datetime.datetime.strptime(date_string, format) 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 ，date_string 指 日 期 字符 串 , format 为 格 
式 化 方式 。 

返回 一 个 datetime 对 象 。 

该 方法 使 用 示例 如 下 (time_strp.py): 


import datetime 





dt = datetime .datetime.now() 
print (f"strptime is:{dt.strptime(str (dt), '%Y-%m-%d %H:%M:$%S.%f')}") 


执行 结果 为 : 

strptime is: 2018-03-11 17:02:22.377412 

7. strftime(format) 

将 格式 字符 串 转 换 为 datetime 对 象 。 

strftime() 方 法 的 语法 如 下 : 

datetime.datetime. strftime(format) 

此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 ，format 为 格式 化 方式 。 
返回 一 个 datetime 对 象 。 

该 方法 使 用 示例 如 下 (time_strfpy) : 


import datetime 





dt = datetime .datetime.now() 
Print (f"strftime is: {dt.strftime('%Y-%m-%d %H:%M:%S')}") 


执行 结果 为 : 
strftime is: 2018-03-11 17:03:07 
下 面 看 一 个 使 用 时 间 格 式 化 符号 操作 datetime.datetime 类 的 示例 (date_time.py) 。 


#!/usr/bin/python 


#-*- coding:UTF-8 -—*- 
Import datetiime 


dt = datetime.datetime.now() 
print (f" 当 前 时 间 : {dt}") 

Print (f" (SY-%m-%d %H:%M:%S: {dt.strftime('%Y-%m-%d %H:%M:%S $f')})") 
Print (f" (SY-%m-%d %H:%M:g%S Sp): {dt.strftime('%y-sm-%d SI:%M:%S Sp')}") 
print (f"%a: {dt.strftime('%a')} ") 

print (f"%A: {dt.strftime('$A')} ") 

print (f"%b: {dt.strftime('$b')} ") 

print (f"sB: {dt.strftime('$B')} ") 

print (f" 日 期 时 间 %c: {dt.strftime('%c')} ") 
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print (f" 日 期 sx: {dt.strftime('sx')} ") 
print (f" 时 间 %X: {dt.strftime('%X')} ") 
print (f" 今 天 是 这 周 的 第 {dt.strftime ('%w')} 天 ") 
print (f" 今 天 是 今年 的 第 {dt.strftime('$j')} 天 ") 
print (f" 这 周 是 今年 的 第 {dt.strftime ('$U')} 周 ") 


执行 结果 
当前 时 间 : 


如 下 : 


2018-03-11 17:05:05.118720 


(SY-%m-%d %H:%M:%S $f): 2018-03-11 17:05:05 118720 
(SY-%m-%d %H:SM:%S %p): 18-03-11 05:05:05 PM 


%a: Sun 


%A: Sunday 


$b: Mar 


$B: March 


日 期 时 间 %c 


: Sun Mar 11 17:05:05 2018 


日 期 $x: 03/11/18 
时 间 %X: 17:05:05 
今天 是 这 周 的 第 0 天 
今天 是 今年 的 第 070 天 
这 周 是 今年 的 第 10 周 


10.4 日 历 模 块 


日 历 〈Calendar) 模块 的 函数 都 与 日 历 相 关 ， 如 输出 某 月 的 字符 月 历 。 星 期 一 默认 是 每 周 的 第 
一 天 , 星期 天 是 默认 的 最 后 一 天 。 更 改 设置 需 调用 calendar.setfirstweekday0 函 数 ， 模 块 包含 以 下 内 
置 函 数 (日 历 模块 在 实际 项 目 中 使 用 并 不 多 ， 此 处 不 对 各 个 函数 做 具体 示例 列举 )。 


1. calendar.calendar(year,w=2,l=1,c=6) 





回 一 个 多 行 字符 串 格式 的 year 年 历 ，3 个 月 一 行 ， 间隔 距 离 为 ec。 每 日 宽度 间隔 为 w 


字符 。 每 行 长 度 为 21* w+18+2* c。1 是 每 星期 的 行 数 。 


2. calendar.firstweekday() 


返回 当前 





每 周 起 始 日 期 的 设置 。 默 认 情 况 下 ， 首 次 载 入 calendar 模块 时 返回 0， 即 星期 一 。 


3. calendarisleap(year) 


如 果 是 图 


年 就 返回 Trme， 否 则 返回 False。 








4. calendar.leapdays(y1,y2) 
返回 在 y1、y2 两 年 之 间 的 半年 总 数 。 


5. calendarmonth(yearmonth,w=2,I=1) 





返回 一 个 


多 行 字符 串 格式 的 year 年 month 月 日 历 ， 两 行 标题 ， 一 周一 行 。 每 日 宽度 间隔 为 w 


字符 。 每 行 长 度 为 7* w+6。1 是 每 星期 的 行 数 。 


222 | Python 3.7 从 零 开始 学 





6. calendarmonthcalendar(yearmonth) 

返回 一 个 整数 的 单 层 典 套 列 表 。 每 个 子 列表 装载 代表 一 个 星期 的 整数 。year 年 month 月 外 的 
日 期 都 设 为 0， 范围 内 的 日 期 由 该 月 第 几 日 表示 ， 从 1 开始 。 

7. calendar.monthrange(year,month) 


返回 两 个 整数 。 第 一 个 是 该 月 星期 几 的 日 期 码 ， 第 二 个 是 该 月 的 日 期 码 。 日 从 0 (星期 一 ) 到 
6 (星期 日 ) ， 月 从 1 到 12。 





8. calendarprcal(yeanw=2,|=1,c=6) 
相当 于 print(calendar.calendar(year,w,l,c))。 


9. calendar.prmonth(year, month,w=2,l=1) 





相当 于 print(calendar.calendar(year, month, w, D)。 

10. calendar.setfirstweekday(weekday) 

设置 每 周 的 起 始 日 期 码 ，0 (星期 一 ) 到 6 (星期 日 )。 

11. calendar.timegm(tupletime) 

和 time.gmtime 相反 ， 接 收 一 个 时 间 元 组 形式 ， 返 回 该 时 刻 的 时 间 戳 。 
12. calendar.weekday(year,month,day) 


返回 给 定 日 期 的 日 期 码 ，0 (星期 一 ) 到 6 〈 星 期 日 ) 。 月 份 为 1 (1 月 ) 到 12 (12 月) 。 
10.5 ”牛刀 小 试 一 一 时 间 大 杂烩 


自 定义 函数 ， 使 用 Time、Calendar 和 datetime 模块 获取 当前 日 期 前 后 N 天 或 N 月 的 日 期 
(date time all style.py) 。 


#!/usr/bin/python 
#-*- coding:UTF-8 -*- 
import calendar 
import datetime 
import time 


year = time.strftime("%Y", time.localtime()) 
mon = time.strftime("%m", time.localtime()) 
day = time.strftime("%d", time.localtime()) 
hour = time.strftime("$%H", time.localtime()) 
min = time.strftime("%M", time.localtime()) 
sec = time.strftime("%S", time.localtime()) 
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执行 效果 如 下 : 


today is: 2018-03-11 

today is: 20180311 

the date time is: 2018-03-11 17:17:03 
data time is: 20180311171703 

2 days after today is: 2018-03-13 

2 days before today is: 2018-03-09 

2 months after today is: 2018-05-11 

2 months before today is: 2018-01-11 

2 months after this month is: 2018-05-01 
2 months before this month is: 2018-01-01 


10.6 调 试 


测试 程序 是 一 件 不 容易 的 事情 ， 本 章 中 的 函数 相对 容易 测试 ， 即 便 如 此 ， 要 选择 一 组 可 以 测 
试 所 有 可 能 发 送 的 错误 的 测试 用 例 也 很 困难 ， 从 某 种 程度 上 说 是 不 可 能 的 ， 可 以 尽 可 能 覆盖 错误 ， 
但 不 能 完全 杜绝 。 

测试 可 以 帮助 我 们 发 现 bug, 但 生成 一 组 好 的 测试 用 例 并 不 容易 ， 即 使 有 好 的 测试 用 例 ， 也 不 
能 确定 程序 完全 正确 。 

引用 一 个 传奇 计算 机 科学 家 Edsger W.Dijkstra 的 话 : 


程序 测试 用 例 可 以 显示 bug 的 存在 ， 但 无 法 显示 它们 的 缺席 ! (Program testing can be used to 


Show the presence of bugs, but never to show their absence! ) 


10.7 温 故 知 新 ， 学 以 致 用 


本 章 主 要 讲述 了 日 期 和 时 间 的 相关 知识 ， 在 本 章 结 束 前 回顾 一 下 学 到 的 知识 。 


(1) 在 Python 中 ， 通 常用 哪 3 种 方式 表示 时 间 ? 
(2) time 模块 有 哪些 常用 方法 ， 都 怎么 使 用 ? 
(3) datetime 模块 有 哪些 常用 方法 ， 都 怎么 使 用 ? 


思考 并 解决 如 下 问题 : 

(1) 定义 一 个 函数 ， 打 印 本 地 时 间 。 

(2) 定义 一 个 函数 ， 将 本 地 时 间 以 “yyyy-mm-dd” 的 格式 打印 出 来 。 

(3) 打印 本 地 时 间 的 时 间 戳 。 

(4) 定义 一 个 函数 ， 实 现 输入 任何 一 个 时 间 戳 ， 都 返回 对 应 的 标准 格式 化 时 间 。 
(5) 定义 一 个 函数 ， 将 标准 时 间 转 化 为 时 间 戳 。 

(6) 定义 一 个 函数 ， 实 现 计 算 两 个 时 间 之 间 相 隔 的 秒 数 。 

(7) 定义 一 个 函数 ， 计 算 任 意 两 个 日 期 时 间 之 间 相 隔 的 天 数 。 
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(8) 定义 一 个 函数 ， 将 calendar 时 间 转 化 为 datatime 类 型 。 
(9) 自 定义 一 个 函数 ， 该 函数 的 功能 为 : 
@ 输入 一 个 字符 (如 lastweek) ， 输 出 上 周一 的 日 期 时 间 和 本 周一 的 日 期 时 间 ， 时 间 以 0 时 
0 分 0 秒 计 〈 如 2016-09-19 00:00:00~2016-09-26 00:00:00) 。 
@ 输入 两 个 字符 (如 pastlday、perlhour) ， 输 出 从 昨天 凌晨 0 点 到 今天 凌晨 0 点 24 小 时 内 
整 点 的 时 间 戳 〈 如 2016-09-25 00:00:00~2016-09-25 01:00:00 的 时 间 惟 ) 。 


小 程序 资源 二 维 码 





小 程序 主 界面 扫 码 看 视频 





正则 表达 式 是 处 理 字 符 串 强大 的 工具 ， 拥 有 独特 的 语法 和 独立 的 处 理 引 擎 ， 效 率 可 能 不 如 str 
自 带 的 方法 ， 但 功能 十 分 强大 。 本 章 我 们 将 学 习 正 则 表达 式 的 基本 使 用 方法 。 


11.1 认识 正则 表达 式 


正则 表达 式 是 一 个 特殊 的 字符 序列 ， 能 帮助 用 户 检查 一 个 字符 串 是 否 与 某 种 模式 匹配 ， 从 而 
达成 快速 检索 或 蔡 换 符合 某 个 模式 、 规 则 的 文本 。 例如 ,可 以 在 文档 中 使 用 一 个 正则 表达 式 表示 特 
定 文字 ， 然 后 将 其 全 部 删除 或 蔡 换 成 别 的 文字 。 

Python 自 1.5 版 本 起 增加 了 re 模块 ， 它 提供 了 Perl 风格 的 正则 表达 式 模式 ，re 模块 使 Python 
语言 拥有 全 部 的 正则 表达 式 功 能 。compile 函数 根据 一 个 模式 字符 串 和 可 选 的 标志 参数 生成 一 个 正 
则 表达 式 对 象 ， 该 对 象 拥有 一 系列 方法 用 于 正则 表达 式 匹 配 和 替换 。 

re 模块 提供 与 compile 函数 功能 完全 一 致 的 函数 ， 这 些 函 数 使 用 模式 字符 串 作 为 第 一 个 参数 。 

字符 串 是 编程 时 涉及 最 多 的 数据 结构 ， 对 字符 串 操 作 的 需求 几乎 无 处 不 在 。 

表 11-1 展示 了 一 些 特殊 字符 在 正则 表达 式 中 的 独特 应 用 , 表 11-2 展示 了 某 些 字符 类 在 正则 表 
达 式 中 的 应 用 。 





表 11-1 特殊 字符 在 正则 表达 式 中 的 应 用 
实例 描述 
匹配 除 "m" 之 外 的 任何 单个 字符 。 要 匹配 包括 "nm' 在 内 的 任意 字符 ， 请 使 用 如 '[\n] 的 模式 
匹配 一 个 数字 字符 ， 等 价 于 [0-9] 
匹配 一 个 非 数 字 字 符 ， 等 价 于 [^0-9] 
匹配 任意 空白 字符 ， 包 括 空格 、 制 表 符 、 换 页 符 等 ， 等 价 于 [\fmwtv] 
匹配 任意 非 空白 字符 ， 等 价 于 [^ nwtw] 




















tlal6lal: 
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〈 续 表 ) 

实例 描述 
\Ww 匹配 包括 下 画 线 的 任意 单词 字符 ， 等 价 于 '[A-Za-z0-9 ] 
\W 匹配 任意 非 单词 字符 ， 等 价 于 '[^A-Za-z0-9 了 

表 11-2 字符 类 在 正则 表达 式 中 的 应 用 
实例 描述 
Pp]ython 匹配 "Python" 或 "python" 
rub[ye] 匹配 "mby" 或 "rube" 
aeiou] 匹配 中 括号 内 的 任意 一 个 字母 
0-9] 匹配 任意 数字 ， 类 似 于 [0123456789] 
a-z] 匹配 任意 小 写字 母 
A-Z] 匹配 任意 大 写字 母 
a-zA-Z0-9] “| 匹配 任意 字母 及 数字 
^aeiou] 匹配 除了 aeiou 字母 以 外 的 所 有 字符 
^0-9] 匹配 除了 数字 外 的 字符 








通过 表 11-1 和 表 11-2 可 以 看 到 ， 一 些 特殊 字符 虽然 很 简短 ， 但 功能 非常 强大 。 下 面 介绍 一 些 
更 详尽 的 正则 表达 式 的 使 用 方式 。 

例如 ,我 们 要 判断 一 个 字符 串 是 否 是 合法 的 Email 地 址 , 可 以 用 编程 的 方式 提取 @ 前 后 的 子 串 ， 
再 分 别 判断 是 否 是 单词 和 域名 。 不 过 这 样 做 不 但 需要 写 一 堆 麻 烦 的 代码 , 而 且 写 出 来 的 代码 难以 重 
复 使 用 ， 面 对 不 同 的 需求 可 能 需要 使 用 不 同 的 代码 实现 。 

正则 表达 式 是 匹配 字符 串 的 强 有 力 的 武器 。 正 则 表达 式 的 设计 思想 是 用 描述 性 语言 为 字符 串 
定义 一 个 规则 ， 凡 是 符合 规则 的 字符 串 ， 我 们 就 认为 “匹配 ”， 和 否则 就 不 匹配 。 正 则 表达 式 的 大 致 
匹配 过 程 是 : 依次 拿 出 表达 式 和 文本 中 的 字符 比较 ， 如 果 每 一 个 字符 都 能 匹配 ， 匹 配 就 成 功 ; 一 旦 
有 匹配 不 成 功 的 字符 ， 匹 配 就 失败 。 

用 正则 表达 式 判 断 一 个 字符 串 是 否 是 合法 的 Email 的 方法 是 : 

(1) 创建 一 个 匹配 Email 的 正则 表达 式 。 

(2) 用 该 正则 表达 式 匹 配 用 户 的 输入 ， 从 而 判断 是 否 合法 。 

下 面 我 们 介绍 如 何 使 用 正则 表达 式 描述 字符 。 

在 正则 表达 式 中 ， 如 果 直接 给 出 字符 ， 就 是 精确 匹配 。 从 表 11-1 可 知 ， 用 \d 可 以 匹配 一 个 数 
字 ， 用 \w 可 以 匹配 一 个 字母 或 数字 ， 例 如 : 








00\d 可 以 匹配 '007， 但 无 法 匹配 '00q'。 
日 ddvd 可 以 匹配 '123!。 
@  \WVWwWNd 可 以 匹配 py3'。 
日 .可 以 匹配 任意 字符 ， 所 以 py 可 以 匹配 pyc' pyo'"py! 等 。 
在 正则 表达 式 中 ， 要 匹配 变 长 的 字符 ， 用 * 表 示 任 意 个 数 的 字符 (包括 0 个 ) ， 用 + 表示 至 少 
一 个 字符 ， 用 ?表示 0 个 或 1 个 字符 ， 用 {mn} 表示 n 个 字符 ， 用 {n,m} 表示 n 一 m 个 字符 。 
下 面 我 们 看 一 个 更 复杂 的 例子 : \d{3}\st\d{3,8}。 该 字符 串 从 左 到 右 解 读 如 下 : 
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\d{3} 表 示 匹 配 3 个 数字 ， 如 '010'; \s 可 以 匹配 一 个 空格 (包括 Tab 等 空白 符 ) ， 所 以 \s+ 表 示 
至 少 有 一 个 空格 ， 如 匹配 ''、"' 等 ; \d{3,8} 表 示 3~8 个 数字 ， 如 '1234567'。 
综 上 所 述 ， 正 则 表达 式 可 以 匹配 以 任意 个 数 的 空格 隔 开 的 带 区 号 的 电话 号 码 。 
如 果 要 匹配 '010-12345' 这 样 的 号 码 呢 ? 由 于 '-' 是 特殊 字符 ， 在 正则 表达 式 中 要 用 内 转 义 ， 因 此 
用 正则 表达 式 表 示 为 df3》-d13,8} 。 
我 们 前 面 讨 论 了 正则 表达 式 的 基本 使 用 方法 ， 不 过 如 果 需 要 匹配 带 有 字符 串 的 字符 串 〈 如 '010 
- 12345') ， 使 用 前 面 的 方式 就 做 不 到 了 ， 在 此 我 们 继续 讨论 一 些 更 复杂 的 匹配 方式 。 
要 更 精确 地 匹配 ， 可 以 用 [] 表 示范 围 ， 例 如 : 
@” [0-9a-zA-Z\ ] 用 以 匹配 数字 、 字 母 或 下 画 线 ， 这 种 方式 可 以 在 一 些 场所 做 输入 值 或 命名 的 合 
法 性 校 验 。 
@ [0-9a-zA-Z\ ]+ 可 以 匹配 至 少 由 一 个 数字 、 字 母 或 下 画 线 组 成 的 字符 串 , 如 'a100''0_Z' 'Py3000'。 
这 种 方式 可 以 校 验 一 个 字符 串 是 否 包含 数字 、 字 母 或 下 画 线 。 
@。 [a-zA-Z\_][0-9a-zA-Z\ ]* 可 以 匹配 由 字母 或 下 画 线 开 头 ， 后 接任 意 个 数字 、 字 母 或 下 画 线 组 成 
的 字符 串 ， 也 就 是 Python 的 合法 变量 。 
ee “[a-zA-Z\_][0-9a-zA-Z\_ ]{0, 19} 更 精确 地 限制 了 变量 的 长 度 是 1~20 个 字符 (前面 1 个 字符 + 后 
面 最 多 19 个 字符 )。 
@ AlIB 用 于 匹配 A 或 B， 如 (Plp) ython 可 以 匹配 Python' 或 'python'。 
@ _ ^ 表 示 行 的 开头 ，Ad 表示 必须 以 数字 开头 。 
@ $ 表 示 行 的 结束 ，\d$ 表 示 必 须 以 数字 结束 。 


这 里 提供 了 正则 表达 式 更 高 级 的 使 用 ， 正 则 表达 式 更 多 匹配 模式 可 以 查看 附录 A 的 A.7。 





11.2 re 模块 


经 过 前 面 的 知识 储备 ， 我 们 可 以 在 Python 中 使 用 正则 表达 式 了 。Python 通过 re 模块 提供 对 正 
则 表达 式 的 支持 。 


11.2.1 re.match 函数 


一 般 使 用 re 的 步骤 是 先 将 正则 表达 式 的 字符 串 形式 编译 为 Pattern 实例 ， 然 后 使 用 Pattern 实 
例 处 理 文本 并 获得 匹配 结果 (一 个 match 函数 ) ， 最 后 使 用 match 函数 获得 信息 ， 进 行 其 他 操作 。 

re.match 函数 尝试 从 字符 串 的 起 始 位 置 匹配 一 个 模式 ， 该 函数 语法 如 下 : 

re.match(pattern, string, flags=0) 

参数 说 明 : pattern 指 匹配 的 正则 表达 式 ;， string 指 要 匹配 的 字符 串 ; flags 为 标志 位 ， 用 于 控制 
正则 表达 式 的 匹配 方式 ， 如 是 否 区 分 大 小 写 、 多 行 匹 配 等 。 

如 果 匹 配 成 功 ，re.match 方法 就 返回 一 个 匹配 的 对 象 ， 和 否则 返回 None。 
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例如 (re_match.py) 


#! /usr/bin/python3 


# -*- coding:UTF-8 一 * 一 


import re 


print (re.match ('hello'，'hello world') .span()) # 在 起 始 位 置 匹配 
Print (re.match('world', "hello world')) # 不 在 起 始 位 置 匹配 


执行 结果 如 下 : 


(0, 5) 
None 


11.2.2 re.search 


方法 


在 re 模块 中 ， 除 了 match 函数 外 ，search 方法 也 经 常 使 用 。 
re.search 方法 用 于 扫描 整个 字符 串 并 返回 第 一 个 成 功 匹 配 的 字符 ， 语 法 如 下 : 


re.search(pattern, string, flags=0) 


参数 说 明 : pattern 指 
正则 表达 式 的 匹配 方式 ， 





匹配 的 正则 表达 式 ; string 指 要 匹配 的 字符 串 ，flags 为 标志 位 ， 用 于 控制 
如 是 否 区 分 大 小 写 、 多 行 匹 配 等 。 


如 果 匹 配 成 功 ，re.search 方法 就 返回 一 个 匹配 的 对 象 ， 否 则 返回 None。 


例如 (re_search.py) 


#! /usr/bin/python3 





# -*- coding:UTF-8 一 * 一 


import re 


print (re.search('hel. 
print (re.search('wor: 


执行 结果 如 下 : 
(0, 5) 


(6, 11) 


11.2.3 re.match 


lo'，'hello world') .span()) # 在 起 始 位 置 匹配 
1d'， "hello world') .span ()) # 不 在 起 始 位 置 匹配 


与 re.search 的 区 别 


re.match 函数 只 匹配 字符 串 开始 的 字符 ， 如 果 开 始 的 字符 不 符合 正则 表达 式 ， 匹 配 就 会 失败 ， 





函数 返回 None。 


re.search 方法 匹配 整个 字符 串 ， 直 到 找到 一 个 匹配 的 对 象 ， 匹 配 结束 后 没 找到 匹配 值 才 返 


None。 








互 











例如 (re_match _search.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 — 


import re 
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line = 'Cats are smarter than dogs' 


matchobj = re.match(r'dogs', line, re.M | re.I) 
if matchObj: 

print (f'use match,the match string is: {matchObj.group()}') 
else: 

print ("No match string!!") 


matchobj = re.search( r'dogs', line, re.M | re.I) 
if matchobj : 

print(f'use search,the match string is: {matchObj.group()}') 
else: 

print ("No match string!!") 


执行 结果 如 下 : 


No match string!! 
use search,the match string is: dogs 


该 示例 使 用 了 match 类 中 的 分 组 方法 一 一 group 方法 。 该 方法 定义 如 下 : 


def group(self, *args): 
"""Return one or more subgroups of the match. 
:rtype: T | tuple 


pass 

group([group1，…]): 获得 一 个 或 多 个 分 组 截获 的 字符 串 , 指定 多 个 参数 时 以 元 组 的 形式 返回 。 
groupl 可 以 使 用 编号 , 也 可 以 使 用 别名 。 编 号 0 代表 整个 匹配 的 子 串 。 不 填写 参数 时 , 返回 group(0); 
没有 截获 字符 串 的 组 时 ， 返 回 None; 截获 多 次 字符 串 的 组 时 ， 返 回 最 后 一 次 截获 的 子 串 。 

还 有 一 个 常用 的 分 组 方法 groups。 

groups([default): 以 元 组 形式 返回 全 部 分 组 截获 的 字符 串 , 相当 于 调用 group(1,2,…last)。 default 
表示 没有 截获 字符 串 的 组 以 这 个 值 代替 ， 默 认为 None。 


11.3” 贪 焚 模 式 和 非 贪 焚 模 式 











正则 表达 式 通 常用 于 查找 匹配 的 字符 串 。 在 Python 中 ， 数 量词 默认 是 贪 禁 的 〈 在 少数 语言 里 
也 可 能 默认 非 贪 禁 ) ， 总 是 尝试 匹配 尽 可 能 多 的 字符 ; 非 贪 禁 模 式 正好 相反 ,总 是 尝试 匹配 尽 可 能 
少 的 字符 。 

例如 ， 正 则 表达 式 "ab*" 如 果 用 于 查找 "abbbc"， 就 会 找到 "abbb"。 如 果 使 用 非 贪 禁 的 数量 词 
"ab*?"， 就 会 找到 "a"。 

例如 (re_groups_1.py) : 

#! /usr/bin/python3 


odingrgre -6 = 二 一 
import re 


Print (re.match(r'^(\d+) (0*)$', '102300').groups()) 
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执行 结果 为 : 

(102300', 75) 

由 于 \d+ 采 用 贪 禁 匹 配 ， 直接 把 后 面 的 0 全 部 匹配 了 ,结果 0* 只 能 匹配 空 字符 串 。 要 让 0* 能 够 
匹配 到 后 面 的 两 个 0， 必须 让 \d+ 采 用 非 贪 禁 匹 配 ( 尽 可 能 少 匹 配 )。 在 0* 后 面 加 一 个 ?就 可 以 让 \d+ 
采用 非 贪 禁 匹 配 。 具 体 实现 如 下 (re_groups 2.py) : 

#! /usr/bin/python3 


# -*- coding:UTF-8 -*— 
import re 





print (re.match(r'^(\d+?) (0*)$', '102300') .groups()) 
执行 结果 为 : 


("1023', '00') 


11.4 替换 


Python 的 re 模块 提供 了 re.subp， 用 于 替换 字符 串 中 的 匹配 项 。 

sub(repl, string[, count]) | re.sub(pattern, repl, string[, count]): 使 用 repl 替换 string 中 每 一 个 匹配 
的 子 串 后 返回 替换 后 的 字符 串 。 当 repl 是 一 个 方法 时 , 这 个 方法 应 当 只 接收 一 个 参数 (match 对 象 )， 
并 返回 一 个 字符 串 用 于 替换 (返回 的 字符 串 中 不 能 再 引用 分 组 )。count 用 于 指定 最 多 替换 次 数 ， 
不 指定 时 全 部 蔡 换 。 

例如 (re_func.py) : 


#! /usr/bin/python3 


# -*- coding:UTF-8 -*— 
Import re 





Ppt = re.compile(r' (w+) (w+)') 
greeting = 'i say, hello world!' 


print (pt.sub(r'2 1', greeting)) 
def func (m) : 
return m.group(1) .title()+' '+m.group(2).title() 
print (Pt.sub(func，greeting) ) 
执行 结果 为 : 


i say, hello world! 
i say, hello world! 
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11.5 编 译 


当 我 们 在 Python 中 使 用 正则 表达 式 时 ，re 模块 内 部 会 做 两 件 事情 : 

(1) 编译 正则 表达 式 ， 如 果 正 则 表达 式 的 字符 串 本 身 不 合法 ， 就 会 报错 。 

(2) 用 编译 后 的 正则 表达 式 匹配 字符 串 。 

如 果 一 个 正则 表达 式 需 要 重复 使 用 几 千 次 ， 出 于 效率 的 考虑 ， 我 们 可 以 预 编译 该 正则 表达 式 ， 
这 样 重复 使 用 时 就 不 需要 编译 这 个 步骤 了 ， 直 接 匹配 即 可 ， 例 如 : 


#! /usr/bin/python3 
# -*- coding:UTF-8 一 * 一 
import re 





re telephone = re.compile(r'^(\d{3})-(\d{3,8})$') 
print (re_telephone .match('010-12345') .groups ()) 
Print (re_telephone.match('010-8086') .groups() ) 


执行 结果 为 : 
('010', '12345') 
('010', '8086') 


匹配 比较 





11.6 “牛刀 小 


给 定 一 个 字符 串 ， 分 别 用 各 种 不 同 的 匹配 方式 对 字符 串 进 行 匹 配 ， 比 较 各 种 匹配 结果 的 异同 。 
示例 如 下 〈all_kinds_match.py) : 


# -*- coding:UTF-8 -*— 
import re 


# 匹配 目标 
def target match(content): 
result = re.match('^Hello\s(\d+) \sWorld', content) 
return result, result.group(), result.group(1), result.span() 


# 通用 匹配 

def gena match (content): 
result = re.match('^Hello.*Demo$', content) 
return result, result.group(), result.span() 


# 贪 禁 匹 配 

def greed_match (content) : 
result = re.match('^He.*(\d+) .*Demo$', content) 
return result, result.group(1) 
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# 非 仿 禁 匹 配 

def un greed _ match (content) : 
result = re.match('^He.*(\d+).*Demo$', content) 
return result, result.group(1) 

if name ==" main ": 
con match = 'Hello 1234567 World _ This is a Regex Demo' 
target match(con match) 
gena _ match (con match) 
greed match(con match) 


result v, result group = un greed match(con match) 
print (result _v, result group) 


可 以 自行 测试 并 打印 结果 ， 观 察 结果 的 异同 。 


11.7 温 故 知 新 ， 学 以 致 用 


正则 表达 式 非 常 强大 ， 本 章 主要 讲述 了 正则 表达 式 的 基本 知识 ， 如 果 你 经 常 遇 到 正则 表达 式 
的 问题 ， 或 者 想 更 深入 地 学 习 ， 建 议 自 备 一 本 正则 表达 式 的 参考 书 。 

在 本 章 结束 前 回顾 一 下 学 习 到 的 概念 。 

(1) 什么 是 正则 表达 式 ? 

(2) re 模块 中 的 match 函数 和 search 方法 怎么 使 用 ， 两 者 的 区 别 是 什么 ? 

(3) 什么 叫 贪 禁 模式 和 非 贪 禁 模式 ? 

思考 并 解决 如 下 问题 

(1) 定义 一 个 函数 ， 对 于 给 定 的 一 个 字符 串 ， 用 正则 表达 式 识 别 对 应 字符 串 。 

(2) 定义 一 个 函数 ,对 于 传 入 的 任意 单词 对 ,使 用 正则 表达 式 匹配 出 其 中 的 空格 所 在 的 位 置 。 

(3) 定义 一 个 函数 ， 使 用 正则 表达 式 匹 配 由 某 个 特殊 符号 分 割 的 任何 单词 和 字母 。 

(4) 定义 一 个 函数 ， 用 正则 表达 式 匹配 以 “www” 开 始 并 且 以 “.org” 结 尾 的 简单 域名 。 

(5) 定义 一 个 函数 ， 用 正则 表达 式 匹 配 输入 的 所 有 仅 包 含 字符 和 数字 的 字符 串 。 

(6) 定义 一 个 函数 , 用 正则 表达 式 可 以 匹配 手机 号 码 是 否 是 有 效 的 号 码 格式 (是 否 全 为 数字 ， 
长 度 以 及 开头 几 位 数字 是 否 是 有 效 的 ) 。 

(7) 定义 一 个 函数 ， 校 验 输 入 的 电子 邮箱 地 址 是 否 是 有 效 的 〈 从 是 否 包含 @ 符 、 是 否 有 “.” 
号 等 方向 考虑 ) 。 

(8) 提取 字符 串 中 完整 的 日 期 时 间 。 

(9) 从 电子 邮件 中 提取 发 送 者 和 接收 者 。 
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第 12 章 


文件 操作 


我 们 目前 的 操作 都 是 很 直观 地 执行 程序 ， 要 么 是 在 交互 模式 下 执行 ， 要 么 是 执行 .py 文件 ， 还 
没有 涉及 对 文件 的 操作 。 

运行 程序 时 ， 用 变量 保存 数据 是 一 种 比较 通用 的 方法 。 如 果 希 望 程序 结束 后 数据 仍然 能 够 保 
存 ， 就 不 能 使 用 变量 保存 数据 了 ， 需 要 寻找 其 他 方式 保存 数据 ,文件 就 是 一 个 不 错 的 选择 。 在 程序 
运行 过 程 中 将 数据 保存 到 文件 中 ,程序 运行 结束 后 ， 相 关 数 据 就 保存 到 文件 中 了 。 当 然 ， 这 涉及 对 
文件 的 操作 。 

通过 本 章 的 学 习 ， 读 者 将 了 解 如 何 使 用 Python 在 硬盘 上 创建 、 读 取 和 保存 文件 。 


12.1 打开 文件 


在 Python 中 ， 打 开 文 件 使 用 的 是 open 函数 。open 函数 的 基本 语法 如 下 : 
open(file_name [, access_mode][, buffering]) 


【参数 解析 】 

e@ file name 变量 : 是 一 个 包含 要 访问 的 文件 名 称 的 字符 串 值 。 

@ _ access mode 变量 : 指 打开 文件 的 模式 ， 对 应 有 只 读 、 写 入 、 追 加 等 。access_mode 变量 值 不 
是 必需 的 (不 带 access mode 变量 时 ， 要 求 file name 存在 ， 和 否则 报 异 常 )， 默 认 的 文件 访问 
模式 为 只 读 (T)。 

@ buffering: 如 果 buffering 的 值 被 设 为 0， 就 不 会 有 寄存 ; 如 果 buffering 的 值 取 1， 访 问 文件 
时 就 会 寄存 行 ; 如果 将 buffering 的 值 设 为 大 于 1 的 整数 ， 表 示 这 就 是 寄存 区 的 缓冲 大 小 ; 如 
果 取 负 值 ， 寄 存 区 的 缓冲 大 小 就 是 系统 默认 的 值 。 


open 函数 返回 一 个 File (文件 ) 对 象 。File 对 象 代表 计算 机 中 的 一 个 文件 ， 是 Python 中 男 一 
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种 类 型 的 值 ， 就 像 我 们 熟悉 的 列表 和 字典 。 
例如 (file_open_1.py) : 
#! /usr/bin/python 


和 =-*=coding:UTF-8=*= 


path = 'd:/test.txt' 
f_name = open (Path) 
Print (f_name.name) 


执行 结果 如 下 : 

d:/test.txt 

执行 结果 告诉 我 们 打开 的 是 d 盘 下 的 test.txt 文件 (执行 该 程序 前 , 已 经 创建 了 一 个 名 为 test.txt 

的 文件 ) 。 

这 里 有 几 个 概念 要 先 弄 清楚 。 

@ 文件 路 径 : 在 该 程序 中 ， 我 们 先 定义 了 一 个 path 变量 ， 变 量 值 是 一 个 文件 的 路 径 。 文 件 的 路 
径 是 指 文件 在 计算 机 上 的 位 置 ， 如 该 程序 中 的 d:/test.txt 是 指 文件 在 d 盘 、 文 件 名 为 test.txt。 
文件 路 径 又 分 为 绝对 路 径 和 相对 路 径 。 

> 绝对 路 径 : 总 是 从 根 文件 夹 开始 。 比 如 在 Windows 环境 下 ， 一 般 从 Cc 盘 、d 盘 等 开始 ，c 
盘 、d 盘 被 称 为 根 文件 夹 ， 在 该 盘 中 的 文件 都 得 从 根 文件 夹 开 始 往 下 一 级 一 级 查找 。 在 
Linux 环境 下 ， 一 般 从 usr、home 等 根 文件 开始 。 比 如 在 上 面 的 示例 程序 中 ，path 变量 值 
就 是 一 个 绝对 路 径 ， 在 文件 搜索 框 中 输入 绝对 路 径 可 以 直接 找到 该 文件 。 

> 相对 路 径 : 相对 于 程序 当前 工作 目录 的 路 径 。 比 如 当前 工作 文件 存放 的 绝对 路 径 是 
d'\python\workspace， 如 果 使 用 相对 路 径 ， 就 可 以 不 写 这 个 路 径 ， 用 一 个 “.” 号 代替 这 个 
路 径 值 。 


例如 (file_open 2.py) : 
#! /usr/bin/python 
# -*-coding:UTF-8-*-— 


path = './test.txt' 


f_name = open(path, 'w') 
Print (f_name.name) 


执行 结果 如 下 : 

/test.txt 

执行 完 程序 后 ， 到 d:\python\workspace 路 径 下 查看 ， 可 以 看 到 创建 了 一 个 名 为 test.txt 的 文件 。 

除了 单个 点 〈.) ， 还 可 以 使 用 两 个 点 〈..) 表示 父 文件 夹 (或 上 一 级 文件 夹 ) 。 此 处 不 有 具体 讨 
论 ， 有 兴趣 可 以 自己 尝试 。 


第 12 章 文件 操作 | 239 





12.1.1 文件 模式 


我 们 在 前 面 讲 到 ， 使 用 open 函数 时 可 以 选择 是 否 传 入 mode 参数 。 在 前 面 的 示例 中 ，mode 传 
入 了 一 个 值 为 w 的 参数 ， 这 个 参数 是 什么 意思 呢 ? mode 可 以 传 入 哪些 值 呢 ? 具体 信息 如 表 12-1 
所 示 。 








表 12-1 文件 模式 
模式 描述 
r 以 只 读 方式 打开 文件 。 文 件 的 指针 将 会 放 在 文件 的 开头 ， 这 是 默认 模式 
rb 以 二 进 制 格式 打开 一 个 文件 用 于 只 读 。 文 件 指针 将 会 放 在 文件 的 开头 ， 这 是 默认 模式 


Tt 打开 一 个 文件 用 于 读 写 。 文 件 指针 将 会 放 在 文件 的 开头 

rbt 以 二 进 制 格式 打开 一 个 文件 用 于 读 写 。 文 件 指针 将 会 放 在 文件 的 开头 

w 打开 一 个 文件 只 用 于 写 入 。 如 果 该 文件 已 存在 ， 就 将 其 覆盖 ， 如 果 该 文件 不 存在 ， 就 创建 新 文件 
以 二 进 制 格式 打开 一 个 文件 只 用 于 写 入 。 如 果 该 文件 已 存在 ， 就 将 其 覆盖 ; 如 果 该 文件 不 存在 ， 就 
创建 新 文件 

wt 打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在， 就 将 其 覆盖 ;如 果 该 文件 不 存在 ， 就 创建 新 文件 
以 二 进 制 格式 打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 ， 就 将 其 覆盖 ;如果 该 文件 不 存在 ， 就 创 
建新 文件 

打开 一 个 文件 用 于 追加 。 如 果 该 文件 已 存在 ， 文 件 指针 就 会 放 在 文件 的 结尾 。 也 就 是 说 ， 新 内 容 将 
会 被 号 入 已 有 内 容 之 后 。 如 果 该 文件 不 存在 ， 就 创建 新 文件 进行 写 入 

以 二 进 制 格式 打开 一 个 文件 用 于 追加 。 如 果 该 文件 已 存在 , 文件 指针 就 会 放 在 文件 结尾 。 也 就 是 说 ， 
新 内 容 将 会 被 号 入 已 有 内 容 之 后 。 如 果 该 文件 不 存在 ， 就 创建 新 文件 进行 写 入 

打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 ， 文 件 指针 就 会 放 在 文件 的 结尾 。 文 件 打开 时 是 追加 模 
式 。 如 果 该 文件 不 存在 ， 就 创建 新 文件 用 于 读 写 

以 二 进 制 格式 打开 一 个 文件 用 于 追加 。 如 果 该 文件 已 存在 ， 文 件 指针 将 会 放 在 文件 结尾 ; 如 果 该 文 
件 不 存在 ， 就 创建 新 文件 用 于 读 写 和 追加 


使 用 open 函数 时 ， 明 确 指定 读 模式 和 什么 模式 都 不 指定 的 效果 是 一 样 的 ， 我 们 在 前 面 的 示例 
中 已 经 验证 。 

使 用 写 模式 可 以 向 文件 写 入 内 容 。+ 参 数 可 以 用 到 其 他 任何 模式 中 ， 指 明 读 和 写 都 是 允许 的 。 
比如 w+ 可 以 在 打开 一 个 文件 时 用 于 文件 的 读 写 。 

当 参 数 带 上 字母 b 时 ， 表 示 可 以 用 来 读 取 一 个 二 进 制 文件 。Python 在 一 般 情况 下 处 理 的 都 是 
文本 文件 ， 有 时 也 不 能 避免 处 理 其 他 格式 的 文件 。 











12.1.2 ”缓存 


open 函数 的 第 3 个 参数 是 可 选择 的 , 该 参数 用 于 控制 文件 的 缓存 ,6 如果 该 参数 赋值 为 0 或 False， 
1O 输入/ 输出) 就 是 无 缓存 的 。 如 果 是 1 或 True，1/O 就 是 有 缓存 的 。 大 于 1 的 整数 代表 缓存 的 
大 小 《单位 是 字 节 ) ，-1 或 小 于 0 的 整数 代表 使 用 默认 的 缓存 大 小 。 

读者 可 能 对 缓存 和 IO 有 些 不 明白 。 缓存 一 般 指 的 是 内 存 , 计算 机 从 内 存 中 读 取 数据 的 速度 远 
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远大 于 从 磁盘 读 取 数 据 的 速度 ,一 般 内 存 大 小 远 小 于 磁盘 大 小 ， 内 存 的 速度 比较 快 , 但 资源 比较 紧 
张 ， 所 以 这 里 有 是 否 对 数据 进行 缓存 的 设置 。 

IO 在 计算 机 中 指 Input/Output， 也 就 是 输入 和 输出 。 由 于 程序 和 运行 时 数据 在 内 存 中 驻 留 ， 
由 CPU 这 个 超 快 的 计算 核心 执行 ， 涉 及 数据 交换 的 地 方 通常 是 磁盘 、 网 络 等 ， 因 此 需要 IO 接口 。 

比如 打开 浏览 器 , 访问 百度 首页 , 浏览 器 需要 通过 网 络 IO 获取 百度 网 页 。 浏览 器 首先 会 发 送 
数据 给 百度 服务 器 ， 告 诉 它 想 要 首页 的 HTML， 这 个 动作 是 往外 发 数据 ， 叫 Output; 随后 百度 服 
务 器 把 网 页 发 过 来 ， 这 个 动作 是 从 外 面 接收 数据 ， 叫 mput。 通 常 ， 程 序 完成 IO 操作 会 有 Input 
和 Output 两 个 数据 流 。 当 然 也 有 只 用 一 个 数据 流 的 情况 ， 比 如 从 磁盘 读 取 文件 到 内 存 ， 只 有 Input 
操作 ， 没 有 Output 操作 ;， 反 过 来 ， 把 数据 写 到 磁盘 文件 里 ， 只 有 Output 操作 ， 没 有 Input 操作 。 


12.2 ”基本 文件 方法 





12.1 节 介 绍 了 打开 文件 的 open 函数 ， 也 做 了 一 些 简单 操作 ， 接 下 来 介绍 一 些 基本 文件 方法 。 
在 开始 介绍 之 前 ， 首 先 需要 了 解 一 下 流 的 概念 。 

IO 编程 中 ， 流 〈Stream) 是 一 个 很 重要 的 概念 。 可 以 把 流 想象 成 一 根 水 管 ， 数 据 就 是 水 管 里 
的 水 ， 但 是 只 能 单 向 流动 。Input Stream 就 是 数据 从 外 面 〈 磁 盘 、 网 络 ) 流 进 内 存 ，Output Stream 
就 是 数据 从 内 存 流 到 外 面 去 。 浏 览 网 页 时 ， 浏 览 器 和 服务 器 之 间 至 少 需要 建立 两 根 水 管 ， 才 能 既 发 
送 数据 又 接收 数据 。 


12.2.1 读 和 写 


open 函数 返回 的 是 一 个 File 对 象 ， 有 了 File 对 象 ， 就 可 以 开始 读 取 内 容 。 如 果 希 望 将 整个 文 
件 的 内 容 读 取 为 一 个 字符 串 值 ， 可 以 使 用 File 对 象 的 read() 方 法 。 

Read() 方 法 从 一 个 打开 的 文件 中 读 取 字符 串 。 需 要 注意 ，Python 字符 串 可 以 是 二 进 制 数据 ， 而 
不 仅仅 是 文字 。 语 法 如 下 : 

fileObject.read([count]); 


fileObject 为 open 函数 返回 的 File 对 象 ，count 参数 是 从 已 打开 的 文件 中 读 取 的 字 节 计数 。 该 
方法 从 文件 的 开头 开始 读 入 ， 如 果 没 有 传 入 count， 就 会 尝试 尽 可 能 多 地 读 取 内 容 ， 很 可 能 一 直 读 
取 到 文件 末尾 。 

比如 我 们 在 test.txt 文件 中 写 入 “Hello world!Welcome!”， 执 行 如 下 代码 (file_ read.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


path = './test.txt' 


f name = open (path, 'r') 
Print (f'read result:{f name.read(12)}') 
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执行 结果 如 下 : 

read result: Hello world! 

由 执行 结果 看 到 ， 通 过 read 方法 我 们 读 取 了 文件 中 从 头 开始 的 12 个 字符 串 。 

将 print(read result:, f name.read(12)) 更 改 为 print(read result',f name.read0)， 得 到 的 执行 结果 
如 下 : 


read result: Hello world!Welcome! 

由 执行 结果 看 到 ， 没 有 指定 读 取 字 节 数 时 ，read 方法 会 读 取 打开 文件 中 的 所 有 字 节 。 

除了 读 取 数 据 外 , 我 们 还 可 以 向 文件 中 写 入 数据 。 在 Python 中 , 将 内 容 写 入 文件 的 方式 与 print 
函数 将 字符 串 输出 到 屏幕 上 类 似 。 

如 果 打开 文件 时 使 用 读 模式 ， 就 不 能 写 入 文件 ， 即 不 能 用 下 面 这 种 形式 操作 文件 : 

open (path, 'rw') 

在 Python 中 ， 用 write0 方 法 向 一 个 文件 写 入 数据 。write0 方 法 可 将 任何 字符 串 写 入 一 个 打开 
的 文件 。 需 要 注意 ，Python 字符 串 可 以 是 二 进 制 数据 ， 而 不 仅仅 是 文字 。 

write0 方 法 不 会 在 字符 串 结 尾 添加 换行 符 (\m') ,语法 如 下 : 





fileObject.write(string); 

fileObject 为 open 函数 返回 的 File 对 象 ，string 参数 是 需要 写 入 文件 中 的 内 容 。 
该 方法 返回 写 入 文件 的 字符 串 的 长 度 。 

例如 (file_write.py) : 


#! /usr/bin/python 
# -*-coding:UTE-8-* 一 





path = !./test.txt'" 


f_name = open(path, 'w') 
Print (f"write length:{f name.write('Hello world!')}") 


执行 结果 如 下 : 

write length: 12 

由 执行 结果 看 到 ， 我们 向 test.txt 文件 中 写 入 了 12 个 字符 。 下 面 验证 一 下 写 入 的 是 否 是 我 们 指 
定 的 字符 ， 在 上 面 的 程序 中 追加 两 行 代码 并 执行 : 


f_name = open(path, 'r') 
print ('read result:', f name.read()) 


执行 结果 如 下 : 


write length: 12 
read result: Hello world! 


由 执行 结果 看 到 ， 写 入 文件 的 是 我 们 指定 的 内 容 。 不 过 这 里 有 一 个 疑问 ,我们 在 这 里 执行 了 
两 次 写 入 操作 ， 得 到 的 结果 怎么 只 写 入 了 一 次 ? 
写 文件 (write) 方法 的 处 理 方式 是 : 将 覆 写 原 有 文件 ， 从 头 开 始 ， 每 次 写 入 都 会 覆盖 前 面 所 
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有 内 容 ,就 像 用 一 个 新 值 覆盖 一 个 变量 的 值 。. 若 需要 在 当前 文件 的 字符 串 后 追加 字符 , 该 怎么 办 呢 ? 
可 以 将 第 二 个 参数 w 更 换 为 a， 即 以 追加 模式 打开 文件 ， 例 如 (file add.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


path = './test.txt' 


f_name = open (path, 'w') 
print (f"write length:{f name.write('Hello world!')}") 
f_name = open (path, 'r') 

print (f'read result:{f name.read()}') 


f name = open(path, 'a') 

print (f"add length:{f name.write('welcome!')}") 
£f_name = open(path, 'r') 

print (f'read result:{f name.read()}') 


执行 结果 如 下 : 


write length: 12 

read result: Hello world! 

add length: 8 

read result: Hello world!welcome! 


由 执行 结果 看 到 ， 输 出 结果 在 文件 末尾 成 功 添加 了 对 应 字符 串 。 


如 果 传递 给 open 函数 的 文件 名 不 存在 ， 写 模式 (Ww ) 和 追加 模式 (a ) 就 会 创建 一 个 新 的 空 
文件 ， 然 后 执行 写 入 或 追加 。 





如 果 想 追加 的 字符 串 在 下 一 行 ， 该 怎么 办 呢 ? 
在 Python 中 ， 用 \ 表示 换行 。 对 于 上 面 的 示例 ， 若 需要 追加 的 内 容 在 下 一 行 ， 可 以 如 下 操作 
(file_change line.py) : 


Path = './test.txt' 

f_name = open(path, 'w') 

print (f"write length:{f name.write('Hello world!')}") 
f_name = open (path, 'r') 

print (f'read result:{f name.read()}') 


f_name = open(path, 'a') 

print ("add length:", f name.write("\nwelcome!")) 
f_name = open (path, 'r') 

Print (f'read result:{f name.read()}') 


执行 结果 如 下 : 


write length: 13 
read result: Hello world! 


add length: 8 
read result: Hello world! 
welcome! 
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由 执行 结果 看 到 ， 后 面 追加 的 内 容 在 下 一 行 了 。 


需要 读 或 写 特定 编码 方式 的 文本 ， 则 需要 给 open 函数 传 入 encoding 参数 ; 若 需要 读 取 


GBK 编码 的 文件 ， 则 前 面 的 示例 可 以 改写 为 f name = open(path, Tr, encoding='gbk)， 这 样 读 
取 到 的 文件 就 是 GBK 编码 方式 的 文件 了 。 





12.2.2 ” 读 写 行 


我 们 目前 对 文件 的 读 操作 是 按 字 节 读 或 整个 读 取 ， 而 写 操作 是 全 部 覆 写 或 追加 ， 这 样 的 操作 
在 实际 应 用 中 很 不 实用 。Python 为 我 们 提供 了 readline()、readlines() 和 writelines() 等 方法 用 于 行 操 
作 ， 例 如 (file_ read write.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*— 


path = './test.txt' 

E_name = open(path, 'w') 

E_name.write('Hello world!\n') 

f name = open(path, 'a') 

f name.write('welcome!') 

f_name = open (path, 'r') 

Print (f'readline result:{f name.readline()}') 

执行 结果 为 : 

readline result: Hello world! 

由 执行 结果 得 知 ，readline 方法 会 从 文件 中 读 取 单独 一 行 ， 换 行 符 为 m。readline 方法 如 果 返 回 
一 个 空 字符 串 ， 说 明 已 经 读 取 到 最 后 一 行 了 。 

readline 方法 也 可 以 像 read 方法 一 样 传 入 数值 读 取 对 应 的 字符 数 , 传 入 小 于 0 的 数值 表示 整 行 
都 输出 。 

如 果 将 上 面 示例 的 最 后 一 行 : 

print (f'readline result:{f_name.readline()}') 

更 改 为 : 

print (f'readline result:{f name.readlines()}') 

得 到 的 输出 结果 为 : 

readline result: ['Hello world!\n', 'welcome!'] 

输出 结果 为 一 个 字符 串 的 列表 。 列 表 中 的 每 个 字符 串 就 是 文本 中 的 每 一 行 ， 并 且 换行 符 也 会 
被 输出 。 

readlines 方法 可 以 传 入 数值 参数 , 当 传 入 的 数值 小 于 等 于 列表 中 一 个 字符 串 的 长 度 值 时 , 该 字 
符 串 会 被 读 取 ， 当 传 入 小 于 等 于 0 的 数值 时 ， 所 有 字符 都 会 被 读 取 。 

例如 (file_read lines.py) : 

















全 
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#! /usr/bin/python 
# -*-coding:UTF-8-*- 


path = './test.txt' 

f_name = open (path, 'w') 

str list = ['Hello world!\n', 'welcome!\n', 'welcome!\n'] 
print (f'write length:{f name.writelines(str list)}') 

f name = open(path,'r') 

print (f'read result:{f name.read()}') 

£f_name = open(path, 'r') 

print (f'readline result:{f name.readlines()}') 


执行 结果 如 下 : 


write length: None 

read result: Hello world! 
welcome! 

welcome! 


readline result: ['Hello world!\n', 'welcome!\n', 'welcome!\n'] 

由 执行 结果 看 到 ，writelines 方法 和 readlines 方法 相反 ， 传 给 它 一 个 字符 串 列表 任何 序列 或 
可 迭代 对 象 ) ， 它 会 把 所 有 字符 串 写 入 文件 。 如 果 没有 writeline 方法 ， 那 么 可 以 使 用 write 方法 代 
蔡 这 个 方法 的 功能 。 


12.2.3 ”关闭 文件 


我 们 前 面 介 绍 了 很 多 读 取 和 写 入 文件 的 内 容 ， 都 没有 提 到 在 读 或 写 文件 的 过 程 中 出 现 异常 时 
该 怎么 处 理 。 在 读 或 写 文件 的 过 程 中 , 出 现 异 常 的 概率 还 是 挺 高 的 , 特别 对 于 大 文件 的 读 取 和 写 入 ， 
出 现 异常 更 是 家 常 便 饭 。 在 读 或 写 文件 的 过 程 中 ， 出 现 异常 该 怎么 处 理 呢 ? 

这 就 需要 用 到 前 面 介 绍 的 异常 的 知识 了 ,用 try 语句 捕获 可 能 出 现 的 异常 。 在 捕获 异常 前 有 一 
个 动作 要 执行 ， 就 是 使 用 close 方法 关闭 文件 。 

一 般 情况 下 ， 一 个 文件 对 象 在 退出 程序 后 会 自动 关闭 ， 但 是 为 了 安全 起 见 ， 还 是 要 显 式 地 写 
一 个 close 方法 关闭 文件 。 一 般 显 式 关闭 文件 读 或 写 的 操作 如 下 〈file_close.py) : 

#! /usr/bin/python 

# -*-coding:UTF-8-*— 


path = './test.txt' 

f_name = open (path, 'w') 

print (f"write length:{f name.write('Hello world!')}") 
f_name.close() 


这 段 代码 和 没有 加 close 方法 的 执行 结果 一 样 。 这 样 处 理 后 的 函数 比 没有 加 close 方法 时 更 安 
全 , 可 以 避免 在 某 些 操作 系统 或 设置 中 进行 无 用 的 修改 ,也 可 以 避免 用 完 系 统 中 所 打开 文件 的 配额 。 

对 内 容 更 改过 的 文件 一 定 要 记得 关闭 ， 因 为 写 入 的 数据 可 能 被 缓存 ， 如 果 程 序 或 系统 因为 某 
些 原因 而 崩溃 ， 被 缓存 部 分 的 数据 就 不 会 写 入 文件 了 。 为 了 安全 起 见 , 在 使 用 完 文件 后 一 定 要 记得 
关闭 。 

当 使 用 try 语句 出 现 异常 时 ， 即 使 使 用 了 close 方法 ， 也 可 能 不 被 执行 ， 这 时 该 怎么 办 呢 ? 

还 记得 finally 子 句 吗 ? 可 以 将 close 方法 放 在 finally 子 句 中 执行 , 从 而 保证 无 论 程序 是 否 正常 
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执行 都 会 调用 close 方法 。 上 面 的 示例 可 以 更 改 成 更 安全 的 形式 (file_safe_close.py) : 
#! /usr/bin/python 


# -*-coding:UTF-8-*- 


path = './test.txt' 
try: 
f name = open(path, 'w') 
print (f"write length:{f name.write('Hello world!')}") 
finally: 
if f_name: 
£f_name.close() 


如 果 每 次 都 要 这 么 写 ， 就 会 很 烦琐 ， 是 否 有 更 简便 的 方式 处 理 呢 ? 

Python 中 引入 了 with 语句 自动 帮 我 们 调用 close 方法 。 可 以 使 用 with 语句 将 上 面 的 程序 更 改 
为 (file_safer_close.py) : 

#! /usr/bin/python 


# -*-coding:UTF-8-*- 


path = './test.txt' 
with open(path, 'w') as f: 
于 name = open (path, 'w') 
print (f"write length:{f name.write('Hello world!')}") 


这 段 代 码 和 上 面 使 用 try/finally 的 效果 一 样 ， 并 且 会 自动 调用 close 方法 ， 不 用 显 式 地 写 该 方 
法 。 可 以 发 现 ， 代 码 比 前 面 简洁 多 了 ， 后 面 可 以 多 用 这 种 方式 编写 。 


12.2.4 ”文件 重 命名 


在 应 用 程序 的 过 程 中 ， 可 能 需要 程序 帮助 我 们 重 命名 某 个 文件 的 名 字 ， 而 不 是 通过 手动 的 方 
式 进 行 ， 这 样 是 否 可 以 呢 ? 

Python 的 os 模块 为 我 们 提供 了 rename 方法 ， 即 文件 重 命名 。 使 用 这 个 方法 需要 导入 os 模块 。 
rename 方法 的 语法 如 下 : 


os.rename(current file name, new_file_name) 


os 为 导入 的 os 模块 ，current_file_name 为 当前 文件 名 ，new_file_ name 为 新 文件 名 。 若 文件 不 
在 当前 目录 下 ， 则 文件 名 需要 带 上 绝对 路 径 。 

该 方法 没有 返回 值 。 

使 用 示例 如 下 (file rename.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*— 
import os 





open('./testl.txt', 'w') 
os.rename('testl.txt', 'test2.txt') 


执行 结果 可 以 到 对 应 目录 下 查看 ， 若 之 前 已 经 创建 了 名 为 testl.txt 的 文件 ， 则 将 文件 名 更 改 为 
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test2.txt; 若 之 前 没有 创建 testl.txt 文件 ， 则 先 创建 testl,txt 文件 ， 然 后 将 文件 名 更 改 为 test2.txt。 


12.2.5 ”删除 文件 


在 应 用 程序 的 过 程 中 ， 我 们 是 否 可 以 通过 程序 删除 某 个 文件 呢 ? 

Python 的 os 模块 为 我 们 提供 了 remove 方法 ， 即 删除 文件 。 使 用 这 个 方法 需要 导入 os 模块 。 
remove 方法 的 语法 如 下 : 

os.remove(file_ name) 

os 为 导入 的 os 模块 ，file_ name 为 需要 删除 的 文件 名 。 若 文件 不 在 当前 目录 下 ， 则 文件 名 需要 
使 用 绝对 路 径 。 

该 方法 没有 返回 值 。 

使 用 示例 如 下 (file remove.py) : 


#! /usr/bin/python 
# -*-coding:UTEF-8-*- 
import os 





try: 

Print (f"remove result:{o0s.remove('test2.txt')}") 
except Exception: 

Print('file not found') 


执行 该 方法 会 把 前 面 的 示例 中 重 命名 的 test2.txt 文件 删除 。 当 然 ， 该 方法 只 能 删除 已 经 存在 的 
文件 ， 文 件 不 存在 就 会 抛 异常 。 


12.3 ”对 文件 内 容 进行 伙 代 


前 面 介 绍 了 文件 的 基本 操作 方法 。 在 实际 应 用 中 ， 对 文件 内 容 进 行 迭 代 和 重复 读 取 文本 是 比 
较 常 见 的 操作 。 
所 谓 迭 代 ， 是 指 不 断 重 复 某 一 个 动作 ， 直 到 这 些 动作 都 完成 为 止 。 


12.3.1 按 字 节 处 理 


在 while 循环 中 , read 方法 是 最 常见 的 对 文件 内 容 进 行 迭 代 的 方法 , 例如 (file read_byte.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


path = './test.txt' 

f_name = open (path, 'w') 

print (f"write length:{f name.write('Hello’')}") 
£_name = open (path) 
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c_str = f name.read(1) 
while c_str: 
print (f'read str is:{c_str}') 
c str = f name.read(1) 
f_name.close() 


执行 结果 如 下 : 


write length: 5 
read str is: H 
read str is: e 
read str is: 1 
read strr is: 1 
read str is: o 


由 执行 结果 看 到 ， 该 示例 对 写 入 文件 的 每 个 字符 都 进行 循环 了 。 这 个 程序 运行 到 文件 末尾 时 ， 
read 方法 会 返回 一 个 空 字符 串 ， 未 执行 到 空 字符 串 前 ， 返 回 的 都 是 非 空 字符 ， 表 示 布 尔 值 为 真 。 

该 示例 中 出 现 了 代码 的 重复 使 用 ， 可 以 使 用 while true/break 语句 结构 进一步 优化 。 优 化 代码 
如 下 (file_read_byte_1.py) : 





E_name = open (path) 
while True: 
c str = f name.read(1) 
if not c¢ str: 
break 
Print (f'read str is:{c str}') 
f_name.close() 


由 代码 结构 看 到 ， 更 改 后 的 代码 比 之 前 更 好 。 


12.3.2 ” 按 行 操作 


在 实际 操作 中 ， 处 理 文件 时 可 能 需要 对 文件 的 行进 行 迭 代 ， 而 不 是 单个 字符 。 此 时 可 以 使 用 
和 处 理 字符 一 样 的 方式 ， 只 不 过 要 使 用 readline 方法 ， 例 如 (file_line read.py) : 


f_name = open (path) 
while True: 
line = f name.readline (1) 
if not line: 
break 
print (f'read line is:{line}') 
f_name.close() 


使 用 该 方式 得 到 的 是 按 行 读 取 的 字符 。 


12.3.3 ”使 用 fileinput 实现 懒 加 载 式 迭代 


我 们 前 面 介绍 过 read 方法 和 readlines 方法 ， 这 两 个 方法 不 带 参数 时 将 读 取 文 件 中 所 有 内 容 ， 
然后 加 载 到 内 存 中 。 当 文件 很 大 时 , 使 用 这 种 方式 会 占用 太 多 内 存 , 甚至 直接 使 内 存 溢出 (内存 不 够 )， 
从 而 导致 执行 失败 。 这 种 情况 下， 我们 可 以 考虑 使 用 while 循环 和 readline 方法 代替 这 些 方 法 。 
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在 Python 中 ，for 循环 是 优先 考虑 的 选择 ， 使 用 for 循环 意味 着 可 以 对 任务 进行 分 隔 操作 ， 而 
不 是 一 步 到 位 。 

按 行 读 取 文件 时 ， 若 能 使 用 for 循环 ， 则 称 之 为 风 加 载 式 和 迭代 ， 因 为 在 操作 过 程 中 只 读 取 实 际 
需要 的 文件 部 分 。 使 用 fileinput 需要 导入 fileinput 模块 ， 例 如 (file inputpy) : 

#! /usr/bin/python 

# -*-coding:UTF-8-*- 


import fileinput 


Path = './test.txt' 
for line in fileinput.input (path): 
print (f'line is:{line}') 


在 该 示例 中 没有 看 到 文件 的 打开 与 关闭 操作 ， 是 怎么 处 理 文件 的 呢 ? 其 实 这 些 操作 被 封装 在 
input 方法 内 部 了 。 


12.3.4 ”文件 迭代 器 


从 Python 2.2 版 本 开始 , 文件 对 象 是 可 夫 代 的 , 这 意味 着 可 以 直接 在 for 循环 中 使 用 文件 对 象 ， 
从 而 进行 迭代 ， 例 如 (file_iter.py》: 


#! /usr/bin/python 
# -*-coding:UTF-8-*— 


path = './test.txt' 
f_name = open (Path) 
for line in f_name: 
print (f'line is:{line}') 
f_name.close() 


该 示例 使 用 for 循环 对 文件 对 象 进行 欠 代 ， 记 住 迭 代 结 束 后 要 显 式 关闭 文件 。 
12.4 _ StringlO 函数 


数据 的 读 取 除了 通过 文件 外 ， 还 可 以 在 内 存 中 进行 。Python 中 的 io 模块 提供 了 对 str 操作 的 
StringIO 函数 。 

要 把 str 写 入 StringIO， 我 们 需要 创建 一 个 StringIO， 然 后 像 文 件 一 样 写 入 。 操 作 示 例如 下 
(string io.py) : 

#! /usr/bin/python 

# -*-coding:UTF-8-*— 

from io import StringIO 


io val = StringIO() 
io_val.write('hello') 
print (f'say:{io val.getvalue ()}') 
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执行 结果 为 : 
say: hello 


由 执行 结果 看 到 ，getvalue() 方 法 用 于 获得 写 入 后 的 str。 

要 读 取 StringIO， 还 可 以 用 str 初始 化 StringIO， 然 后 像 读 文件 一 样 读 取 。 操 作 示例 如 下 
(str io read.py) : 

#! /usr/bin/python 

# -*-coding:UTF-8-*- 

from io import StringIO 


io val = StringI0('Hello\nWorld!\nWelcome!') 
while True: 
line = io val.readline() 
if line == '': 
break 
print (f'line value: {line.strip()}') 


执行 结果 如 下 : 


line value: Hello 
line value: World! 
line value: Welcome! 


12.5 ”序列 化 与 反 序列 化 


在 运行 程序 的 过 程 中 ， 所 有 变量 都 在 内 存 中 ， 我 们 把 变量 从 内 存 中 变 成 可 存储 或 传输 的 过 程 
称 为 序列 化 。 我 们 可 以 把 序列 化 后 的 内 容 写 入 磁盘 ， 或 者 通过 网 络 传输 到 别 的 机 器 上 。 反 过 来 ， 把 
变量 内 容 从 序列 化 的 对 象 重新 读 到 内 存 里 称 为 反 序列 化 。 

序列 化 是 指 将 数据 结构 或 对 象 转换 成 二 进 制 串 的 过 程 。 

反 序 列 化 是 指 将 序列 化 过 程 中 生成 的 二 进 制 串 转换 成 数据 结构 或 对 象 的 过 程 。 

下 面 我 们 介绍 Python 中 序列 化 和 反 序 列 化 的 方式 。 


12.5.1 ”一般 序列 化 与 反 序列 化 


Python 的 pickle 模块 实现 了 基本 数据 序列 和 反 序列 化 。 

通过 pickle 模块 的 序列 化 操作 ， 能 够 将 程序 中 运行 的 对 象 信息 保存 到 文件 中 ， 从 而 永久 存储 。 
通过 pickle 模块 的 反 序列 化 操作 ， 能 够 从 文件 中 创建 上 一 次 程序 保存 的 对 象 。 

pickle 模块 的 基本 接口 如 下 : 


pickle.dump (obj, file, [,protocol]) 


例如 (file_pickle.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 
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import pickle 


d = dict (name='xiao zhi', num=1002) 
print (pickle.dumps (Gd) ) 


pickle.dumps() 方 法 把 任意 对 象 序列 化 成 一 个 bytes， 然 后 把 这 个 bytes 写 入 文件 。 也 可 以 使 用 
男 一 种 方法 pickle.dump0 ， 直 接 把 对 象 序列 化 后 写 入 一 个 文件 对 象 中 ， 程 序 如 下 
(file_pickle_ write.py) : 





Ew 
d = dict(name='xiao zhi', num=1002) 
E_name = open('dump.txt', 'wb') 
pickle.dump(d, f name) 
finally: 
£f_name.close() 
打开 dump.txt 文件 ， 可 以 看 到 里 面 有 一 堆 看 不 懂 的 内 容 ， 这 些 都 是 Python 保存 的 对 象 的 内 部 
信息 。 
既然 已 经 将 内 容 序列 化 到 文件 中 了 ， 使 用 文件 时 就 需要 把 对 象 从 磁盘 读 到 内 存 。 可 以 先 把 内 
容 读 到 一 个 bytes， 然 后 用 pickle.loads() 方 法 反 序列 化 对 象 ， 也 可 以 直接 用 pickle.load0 方 法 从 一 个 
文件 对 象 中 直接 反 序 列 化 对 象 。 从 dump.txt 文件 中 将 序列 化 的 内 容 反 序列 化 的 代码 如 下 
(file_pickle load.py) : 
#! /usr/bin/python 
# -*-coding:UTF-8-*- 
import pickle 
tw 
f name = open('dump.txt', 'rb') 
print (f'load result:{pickle.load(f name)}') 
finally: 
f_name.close() 


执行 结果 如 下 : 


load result: {'num': 1002, 'name': 'xiao zhi'} 


由 执行 结果 看 到 ， 变 量 的 内 容 被 正确 读 取出 来 了 。 不 过 ， 虽 然 内 容 相同 ， 但 是 对 应 的 变量 已 


经 完全 不 同 了 。 


pickle 的 序列 化 和 反 序 列 化 只 能 用 于 Python， 不 同 版 本 的 Python 可 能 彼此 都 不 兼容 ， 因 此 
pickle 一 般 用 于 保存 不 重要 的 数据 ， 也 就 是 不 能 成 功 反 序列 化 也 没关系 的 数据 。 





12.5.2 ” JSON 序列 化 与 反 序列 化 


我 们 在 12.5.1 小 节 介绍 的 pickle 模块 是 Python 中 独 有 的 序列 化 与 反 序列 化 模块 ， 本 节 介绍 的 
JSON 方式 是 通用 的 。 
JSON (JavaScript Object Notation) 是 一 种 轻 量 级 的 数据 交换 格式 ， 是 基于 ECMAScript 的 一 
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个 子 集 。 


Python 3 中 可 以 使 用 json 模块 对 JSON 数据 进行 编码 和 解码 ， 包 含 以 下 两 个 函数 。 


json.dumps(): 对 数据 进行 编码 。 
json.loads(): 对 数据 进行 解码 。 


在 JSON 的 编码 和 解码 过 程 中 , Python 的 原始 类 型 与 JSON 类 型 会 相互 转换 , 具体 的 转化 对 照 


如 表 12-2 和 表 12-3 所 示 。 


表 12-2 Python 编码 为 JSON 类 型 
































Python JSON 
dict 0 
list, tuple 0 
str string 
int or float number 
True/False true/false 
None null 

表 12-3 JSON 解码 为 Python 类 型 
JSON Python 
0 dict 
0 list 
string str 
number (int or float) int or float 
true/false True/False 
null None 





下 面 是 JSON 序列 化 与 反 序列 化 的 示例 (file_ json_dumps.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*— 


import json 


data = { 'num': 1002, 


'name': 'xiao zhi'} 


json_str = json.dumps (data) 
print (f"Python 原始 数据 : {data}") 
print (f"JSON 对 象 ; {json_str}") 


执行 结果 如 下 : 
Python 原始 数据 : {'name': 'xiao zhi'，'num': 1002} 
JSON 对 象 : {"name": "xiao zhi", "num": 1002} 


接着 以 上 示例 ， 我 们 可 以 将 一 个 JSON 编码 的 字符 串 转 换 为 一 个 Python 数据 结构 ， 代 码 如 下 
(file_json loads.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 
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import json 
data = { 'num': 1002, 'name': "xiao zhi'} 


json_str = json.dumps (data) 
print (f"Python 原始 数据 : {data}") 
print (f"JSON 对 象 ; {json str}") 


data2 = json.loads (json str) 
print (f"data2['name']: {data2['name']}") 
print (f"data2['num']: {data2['num']}") 


执行 结果 如 下 : 


Python 原始 数据 : {'num': 1002，'name': 'xiao zhi'} 
JSON 对 和 象 : {"num": 1002, "name": "xiao zhi"} 
data2['name']: xiao zhi 

data2['num']: 1002 


如 果 要 处 理 的 是 文件 而 不 是 字符 串 ， 就 可 以 使 用 json.dump() 和 json.load0 编 码 、 解 码 JSON 


数据 ， 进 行 如 下 处 理 : 


件 ， 


# 写 入 JSON 数据 
with open('dump.txt', 'w') as f: 
json.dump (data, f£) 


# 读 取 数 据 
with open('dump.txt', 'r') as f: 
data = json.load(f) 


12.6 ”牛刀 小 试 一 一 批量 更 改 文件 名 


编程 实现 ， 对 某 个 目录 文件 下 的 所 有 文件 ， 包 括 子 目录 下 的 文件 ， 以 某 些 指定 后 缀 结尾 的 文 
都 以 男 一 种 指定 的 命名 方式 将 文件 重 命名 。 

思维 点 拨 : 

(1) 文件 目录 下 文件 遍历 ，《〈2) 文件 后 绥 获 取 ; 《〈3) 子 目录 文件 遍历 。 

示例 代码 如 下 〈batch_file rename.py) : 


#-*- coding:UTF-8 —*— 
import os 
import time 


# ”批量 文件 重 命名 
def batch_ rename (path) : 
global img num 
if not os.path.isdir(path) and not os.path.isfile (path): 
return False 


if os.path.isfile(path): 
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# 分 割 出 目录 与 文件 
file path = os.path. split (path) 
# 分 割 出 文件 与 文件 扩展 名 
lists = file path[1] .split('.') 
# 取出 后 缀 名 (列表 切片 操作 ) 
file ext = lists[-1] 
img ext = ['bmp', 'jpeg', 'gif', 'psd', 'png', 'jpg'] 
if file ext in img ext: 
os.rename (path, file path[0] + '/' + lists[0] + '_cn.' + file ext) 
img num += 1 
elif os.path.isdir (Path) : 
for ;item in os.listdir(path): 
## 递归 调用 
batch rename (os.path.join(path, item)) 
if name ==" main ": 
img_dir = 'F:\\download\\vpn' 
img dir = img dir.replace('\\','/') 
start = time.time() 
img num = 0 
batch_rename (img_dir) 
print (' 总 共处 理 了 %s 张 图 片 ， 耗 时 : 8%0.2f.' $ (img_num, time.time() - start) ) 


执行 程序 ， 得 到 如 下 打印 结果 : 
总 共处 理 了 10 张 图 片 ， 耗 时 ;0.01 . 


12.7 调 试 


当 我 们 读 取 和 写 入 文件 时 ， 经 常 遇 到 和 空白 字符 相关 的 问题 。 这 些 问题 可 能 很 难 调试 ， 因 为 
空格 、 制 表 符 和 换行 符 通 常 是 不 可 见 的 ， 例 如 : 

>>> str val = '1 2\t 3\n 4 5' 

>>> print(str val) 

2 

45 

在 这 种 情况 下 ，Python 为 我 们 提供 了 repr 函数 。 该 函数 可 接收 任何 对 象 作为 参数 ， 并 返回 对 
象 的 字符 串 表达 形式 。 上 面 的 示例 可 以 更 改 为 : 

>>> print(repr(str val)) 

2 3Nn A 5 


结果 把 字符 原本 输出 了 。 在 实际 应 用 中 ， 使 用 这 种 方式 可 以 帮助 调试 。 

男 一 个 经 常 遇 到 的 问题 是 不 同系 统 使 用 不 同 的 字符 表示 换行 。 有 的 系统 使 用 换行 符 (\n) 表示 
换行 ， 有 的 系统 使 用 回 车 符 (\r) 表示 换行 ， 也 有 的 系统 两 者 都 使 用 。 如 果 我 们 编写 的 代码 在 不 同 
系统 上 使 用 ， 这 些 不 一 致 就 可 能 导致 异常 。 

当然 ， 大 多 数 系统 都 有 程序 支持 将 一 种 格式 转换 为 另 一 种 格式 。 如 果 不 能 满足 要 求 ， 读 者 也 
可 以 自己 写 一 个 。 
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12.8 ”问题 解答 


在 Python 中， 文件 的 操作 应 用 得 多 吗 ? 

答 : 在 Python 中 ， 文 件 的 操作 应 用 得 非常 多 。 比 如 大 数据 领域 ， 涉 及 许多 数据 处 理 的 需求 ， 
数据 处 理 就 是 从 一 个 文件 对 数据 进行 相关 分 析 、 抽 取 或 重 写 后 ， 再 写 入 另 一 个 文件 ,通过 对 不 同文 
件 的 数据 处 理 与 加 工 ， 从 而 达到 化 繁 为 简 、 梳 理 数据 的 作用 。 在 这 个 过 程 中 ,很 多 地 方 都 需要 使 用 
Python 脚本 实现 。 


12.9 温 故 知 新 ， 学 以 致 用 


本 章 主 要 讲述 了 正则 表达 式 的 相关 知识 ， 在 本 章 结 束 前 回顾 一 下 学 到 的 概念 。 
(1) 怎么 打开 和 关闭 文件 ? 

(2) 如 何 对 行进 行 读 和 写 ? 

(3) 怎么 迭代 文件 内 容 ? 

思考 并 解决 如 下 问题 : 


(1) 打开 一 个 文件 ， 读 取 文 件 中 的 内 容 。 

(2) 创建 一 个 文件 ， 向 文件 中 写 入 一 些 字符 。 

(3) 打开 一 个 文件 ， 向 文件 中 换行 追加 一 些 字符 。 

(4) 对 文件 重 命名 。 

(5) 读 取 一 个 文件 ， 将 文件 中 的 内 容 按 字 节 一 个 一 个 读 取 ， 当 发 现 某 个 特定 字符 时 ， 记 录 下 
读 取 的 位 置 ， 再 继续 读 取 ， 直 到 所 有 字 节 读 取 完 成 。 

(6) 读 取 一 个 文件 ， 将 文件 内 容 按 行 读 取 ， 打 印 出 文本 中 的 字符 表示 形式 。 

(7) 操作 文件 ， 对 写 入 的 文本 内 容 做 序列 化 和 反 序列 化 操作 。 

(8) 使 用 本 章 所 学 的 内 容 向 一 个 文件 中 写 入 一 首 诗 , 要 求 打开 文件 看 到 的 文本 格式 像 一 首 诗 
即 标 题 在 中 间 位 置 ， 一 句 诗 一 行 。 

(9) 结合 当前 所 学 或 参考 网 上 资料 ， 更 改 诗句 中 的 某 个 字 。 

(10) 统计 诗 中 各 个 词 或 字 出 现 的 频率 ， 将 统计 结果 写 入 另 一 个 文件 中 。 统 计 结 果 格式 自己 
定义 〈 越 简单 清楚 越 好 ) 。 
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小 程序 资源 二 维 码 






代码 实例 





小 程序 主 界面 扫 码 看 视频 





第 13 章 
多 线程 


多 线程 编程 技术 可 以 实现 代码 并 行 ， 优 化 处 理 能 力 ， 同 时 可 以 将 代码 划分 为 功能 更 小 的 模块 ， 
使 代码 的 可 重用 性 更 好 。 





本 章 将 介绍 Python 中 的 多 线程 编程 。 多 线程 一 直 是 Python 学 习 中 的 重点 和 难点 , 需要 反复 练 
习 和 研究 。 


13.1 ”线程 和 进程 


在 学 习 多 线程 的 使 用 之 前 ， 需 要 先 了 解 线程 、 进 程 、 多 线程 的 概念 。 


13.1.1 ”进程 


进程 (Process， 有 时 被 称 为 重量 级 进程 ) 是 程序 的 一 次 执行 。 每 个 进程 都 有 自己 的 地 址 空间 、 
内 存 、 数 据 栈 以 及 记录 运行 轨迹 的 辅助 数据 ， 操 作 系统 管理 运行 的 所 有 进程 ,并 为 这 些 进 程 公平 分 
配 时 间 。 进 程 可 以 通过 fork 和 spawn 操作 完成 其 他 任务 。 因 为 各 个 进程 有 自己 的 内 存 空间 、 数 据 
栈 等 ， 所 以 只 能 使 用 进程 间 通 信 (Inter Process Communication，IPC) ， 而 不 能 直接 共享 信息 。 


13.1.2 ”线程 


线程 (Thread， 有 时 被 称 为 轻 量 级 进程 ) 跟 进 程 有 些 相似 ， 不 同 的 是 所 有 线程 运行 在 同一 个 进 
程 中 ， 共 享 运行 环境 。 

线程 有 开始 、 顺 序 执行 和 结束 3 部 分 ， 有 一 个 自己 的 指令 指针 ， 记 录 运 行 到 什么 地 方 。 线 程 
的 运行 可 能 被 抢占 中断 ) 或 暂时 被 挂 起 (睡眠 ) ， 从 而 让 其 他 线程 运行 ， 这 叫 作 让 步 。 一 个 进程 
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中 的 各 个 线程 之 间 共 享 同一 块 数据 空间 , 所 以 线程 之 间 可 以 比 进程 之 间 更 方便 地 共享 数据 和 相互 通信 。 

线程 一 般 是 并 发 执行 的 。 正 是 由 于 这 种 并 行 和 数据 共享 的 机 制 ， 使 得 多 个 任务 的 合作 变 得 可 
能 。 实际 上 , 在 单 CPU 系统 中 , 真正 的 并 发 并 不 可 能 ， 每 个 线程 会 被 安排 成 每 次 只 运行 一 小 会 儿 ， 
然后 就 把 CPU 让 出 来 ， 让 其 他 线程 运行 。 

在 进程 的 整个 运行 过 程 中 ， 每 个 线程 都 只 做 自己 的 事 ， 需 要 时 再 跟 其 他 线程 共享 运行 结果 。 
多 个 线程 共同 访问 同一 块 数据 不 是 完全 没有 和 危险 的 , 由 于 访问 数据 的 顺序 不 一 样 , 因此 有 可 能 导致 
数据 结果 不 一 致 的 问题 ， 这 叫 作 竞 态 条 件 。 大 多 数 线程 库 都 带 有 一 系列 同步 原 语 , 用 于 控制 线程 的 
执行 和 数据 的 访问 。 








13.1.3 ”多 线程 与 多 进程 


对 于 “多 任务 ”这 个 词 ， 相 信 读 者 不 会 是 第 一 次 看 见 ,现在 的 操作 系统 (如 Mac OS X、UNIX、 
Linux、Windows 等 ) 都 支持 “多 任务 ”操作 系统 。 

什么 叫 “ 多 任务 ” 呢 ? 简单 地 说 ， 就 是 系统 可 以 同时 运行 多 个 任务 。 比 如 ， 一 边 用 浏览 器 上 
网 ， 一 边 听 云 音乐 ， 一 边 聊天 ， 这 就 是 多 任务 。 此 时 手头 已 经 有 3 个 任务 在 运行 了 。 如 果 查 看 任务 
管理 器 ， 可 以 看 到 还 有 很 多 任务 悄悄 在 后 台 运 行 着 ， 只 是 桌面 上 没有 显示 而 已 。 

对 于 操作 系统 来 说 ， 一 个 任务 就 是 一 个 进程 ， 开 启 多 个 任务 就 是 多 进程 。 

有 些 进程 不 止 可 以 同时 做 一 件 事 ， 比 如 Word 可 以 同时 打字 、 检 查 拼写 、 打 印 等 。 在 一 个 进程 
内 部 ， 要 同时 做 多 件 事 ， 就 需要 同时 运行 多 个 线程 。 

多 线程 类 似 于 同时 执行 多 个 不 同 的 程序 ， 多 线程 运行 有 以 下 3 个 优点 : 

(1) 使 用 线程 可 以 把 占据 长 时 间 的 任务 放 到 后 台 去 处 理 。 

(2) 用 户 界面 可 以 更 加 吸引 人 ， 比 如 用 户 单 击 一 个 按钮 ， 用 于 触发 某 些 事件 的 处 理 ， 可 以 弹 
出 一 个 进度 条 显示 处 理 的 进度 。 

(3) 程序 的 运行 速度 可 能 加 快 。 


在 实现 一 些 等 待 任务 〈 如 用 户 输入 、 文 件 读 写 和 网 络 收发 数据 等 ) 时 ， 使 用 多 线程 更 加 有 用 。 
在 这 种 情况 下 ， 我 们 可 以 释放 一 些 珍贵 资源 〈 如 内 存 占 用 等 ) 。 

线程 在 执行 过 程 中 与 进程 还 是 有 区 别 的 。 每 个 独立 线程 有 一 个 程序 运行 的 入 口 、 顺 序 执行 序 
列 和 程序 的 出 口 。 但 是 线程 不 能 独立 执行 ， 必 须 依存 在 进程 中 ， 由 进程 提供 多 个 线程 执行 控制 。 

由 于 每 个 进程 至 少 要 干 一 件 事 ， 因 此 一 个 进程 至 少 有 一 个 线程 。 当 然 ， 如 Word 这 种 复杂 的 进 
程 可 以 有 多 个 线程 , 多 个 线程 可 以 同时 执行 。 多 线程 的 执行 方式 和 多 进程 是 一 样 的 ， 也 是 由 操作 系 
统 在 多 个 线程 之 间 快 速 切换 ， 让 每 个 线程 都 短暂 交替 运行 ,看 起 来 就 像 同时 执行 一 样 。 当 然 ， 真 正 
同时 执行 多 线程 需要 多 核 CPU 才能 实现 。 

我 们 前 面 编写 的 所 有 Python 程序 都 是 执行 单 任务 的 进程 ， 也 就 是 只 有 一 个 线程 。 如 果 我 们 要 
同时 执行 多 个 任务 ， 怎 么 办 呢 ? 

有 两 种 解决 方法 : 一 种 方法 是 启动 多 个 进程 ， 每 个 进程 虽然 只 有 一 个 线程 ， 但 多 个 进程 可 以 
一 起 执行 多 个 任务 ; 另 一 种 方法 是 启动 一 个 进程 ,在 一 个 进程 内 启动 多 个 线程 ,这样 多 个 线程 也 可 
以 一 起 执行 多 个 任务 。 

当然 ， 还 有 第 3 种 方法 ， 就 是 启动 多 个 进程 ， 每 个 进程 再 启动 多 个 线程 ， 这 样 同时 执行 的 任 
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务 就 更 多 了 ， 不 过 这 种 模型 过 于 复杂 ， 实 际 很 少 采 用 。 

同时 执行 多 个 任务 时 ， 各 个 任务 之 间 并 不 是 没有 关联 的 ， 而 是 需要 相互 通信 和 协调 ， 有 时 任 
务 1 必须 暂停 等 待 任 务 2 完成 后 才能 继续 执行 , 有 时 任务 3 和 任务 4 不 能 同时 执行 。 多 进程 和 多 线 
程 程序 的 复杂 度 远 远 高 于 我 们 前 面 写 的 单 进程 、 单 线程 的 程序 。 

不 过 很 多 时 候 ， 没 有 多 任务 还 真 不 行 。 想 想 在 计算 机 上 看 电影 ， 必 须 由 一 个 线程 播放 视频 ， 
男 一 个 线程 播放 音频 , 否则 使 用 单线 程 实现 只 能 先 把 视频 播放 完 再 播放 音频 , 或 者 先 把 音频 播放 完 
再 播放 视频 ， 这 样 显然 不 行 。 

总 而 言 之 ， 多 线程 是 多 个 相互 关联 的 线程 的 组 合 ， 多 进程 是 多 个 互相 独立 的 进程 的 组 合 。 线 
程 是 最 小 的 执行 单元 ， 进 程 至 少 由 一 个 线程 组 成 。 


13.2 ”使 用 线程 


人 





如 何 使 用 线程 ， 线 程 中 有 哪些 比较 值得 学 习 的 模块 呢 ? 本 节 将 对 线程 的 使 用 做 概念 性 的 讲解 ， 
下 一 节 再 给 出 一 些 具体 示例 以 供 参 考 。 


13.2.1 全 局 解释 器 锁 


Python 代码 的 执行 由 Python 虚拟 机 解释 器 主 循环 ) 控制 。Python 在 设计 之 初 就 考虑 到 在 主 
循环 中 只 能 有 一 个 线程 执行 ， 虽 然 Python 解释 器 中 可 以 “运行 ”多 个 线程 ， 但 是 在 任意 时 刻 只 有 
一 个 线程 在 解释 器 中 运行 。 

Python 虚拟 机 的 访问 由 全 局 解释 器 锁 (Global Interpreter Lock，GIL) 控制 ， 这 个 锁 能 保证 同 
一 时 刻 只 有 一 个 线程 运行 。 

在 多 线程 环境 中 ，Python 虚拟 机 按 以 下 方式 执行 : 

(1) 设置 GIL。 

(2) 切换 到 一 个 线程 运行 。 

(3) 运行 指定 数量 的 字 节 码 指令 或 线程 主动 让 出 控制 (可 以 调用 time.sleep(0)〉。 
(4) 把 线程 设置 为 睡眠 状态 。 

(5) 解锁 GIL。 

(6) 再 次 重复 以 上 所 有 步骤 。 


在 调用 外 部 代码 (如 C/C++ 扩展 函数 ) 时 ，GIL 将 被 锁定 ， 直 到 这 个 函数 结束 为 止 〈 由 于 在 
此 期 间 没有 运行 Python 的 字 节 码 ， 因 此 不 会 做 线程 切换 )》， 编 写 扩展 的 程序 员 可 以 主动 解锁 GIL。 


13.2.2 ”退出 线程 


当 一 个 线程 结束 计算 后 ， 它 就 退出 了 。 线 程 可 以 调用 _thread.exit() 等 退出 函数 ， 也 可 以 使 用 
Python 退出 进程 的 标准 方法 (如 sys.exit0) 或 抛 出 一 个 SystemExit 异常 ) ， 不 过 不 可 以 直接 “ 杀 掉 ” 
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(kill) 一 个 线程 。 
不 建议 使 用 _thread 模块 。 很 明显 的 一 个 原因 是 ， 当 主线 程 退出 时 ， 其 他 线程 如 果 没有 被 清除 
就 会 退出 。 另 一 个 模块 threading 能 确保 所 有 “重要 的 ” 子 线程 都 退出 后 ， 进 程 才 会 结束 。 


13.2.3 ”Python 的 线程 模块 


Python 提供 了 几 个 用 于 多 线程 编程 的 模块 ， 包 括 _thread、threading 和 Queue 等 。 thread 和 
threading 模块 允许 程序 员 创 建 和 管理 线程 。_thread 模块 提供 了 基本 线程 和 锁 的 支持 ，threading 提 
供 了 更 高 级 别 的 、 功 能 更 强 的 线程 管理 功能 。Queue 模块 允许 用 户 创建 一 个 可 以 用 于 多 个 线程 之 间 
共享 数据 的 队列 数据 结构 。 

避免 使 用 _thread 模块 的 原因 有 3 点 。 首 先 ， 更 高 级 别 的 threading 模块 更 为 先进 ， 对 线程 的 支 
持 更 为 完善 ， 而 且 使 用 _thread 模块 里 的 属性 有 可 能 与 threading 冲突 ; 其 次 ， 低 级别 的 _thread 模块 
的 同步 原 语 很 少 (实际 上 只 有 一 个 ) ， 而 threading 模块 有 很 多 ; 再 次 ，_thread 模块 中 ， 在 主线 程 
结束 时 ， 所 有 线程 都 会 被 强制 结束 ， 没 有 警告 ， 也 不 会 有 正常 清除 工作 ， 至 少 threading 模块 能 确 
保重 要 子 线程 退出 后 进程 才 退 出 。 








13.3 thread 模块 


Python 调用 _ thread 模块 中 的 start_new_thread0) 函 数 产生 新 线程 。_ thread 的 语法 如 下 : 
_thread.start_ new_thread (function, args[, kwargs]) 


其 中 ，function 为 线程 函数 ，args 为 传递 给 线程 函数 的 参数 ， 必 须 是 tuple 类 型 ，kwargs 为 可 
选 参数 。 

_thread 模块 除了 产生 线程 外 ， 还 提供 基本 同步 数据 结构 锁 对 象 (lock object， 也 叫 原 语 锁 、 简 
单 锁 、 互 斥 锁 、 互 斥 量 、 二 值 信 号 量 ) 。 同 步 原 语 与 线程 管理 是 密 不 可 分 的 。 

我 们 看 如 下 示例 (exp_thread_1.py) 。 


#! /usr/bin/python 
# -*-coding:;UTF-8-*- 


import _thread 
from time import sleep 
from datetime import datetime 


date time format = '%y-%M-%d SH:$M:%5' 


def date time str(date time): 
return datetime.strftime (date time, date time format) 


def loop one(): 
print (f'+++ 线 程 一 开始 于 : {date_ time str (datetime.now())}') 
print ('+++ 线 程 一 休眠 4 秒 ') 
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行 时 间 (3 


Sleep (4) 
Print (f'+++ 线 程 一 休眠 结束 ， 结 束 于 : {date_time _str(datetime.now())}7) 


def loop two(): 
print (f'*** 线 程 二 开始 时 间 : {date_time_str (datetime.now())}') 
Print ('*** 线 程 二 休眠 2 秒 ') 
sleep (2) 
print (f'*** 线 程 二 休 卢 结束 ， 结 束 时 间 : {date time str(datetime.now())}') 


def main(): 
print (f'——-———-) 所 有 线程 开始 时 间 : {date_time_str (datetime.now())}') 
_thread.start new thread(loop one, ()) 
_thread.start new thread(loop two, ()) 


sleep(6) 

Print (f'—————- 所 有 线程 结束 时 间 : {date_time_str (datetime.now())}') 
if _name ==" main_': 

main() 
执行 结果 如 下 : 


一 一 所 有 线程 开始 时 间 : 18-27-11 20:27:52 
+++ 线 程 一 开始 于 : *** 线 程 二 开始 时 间 : 18-27-11 20:27:5218-27-11 20:27:52 


+++ 线 程 一 休眠 4 秒 

*** 线 程 二 休眠 2 秒 

*** 线 程 二 休 卢 结束， 结束 时 间 : 18-27-11 20:27:54 
+++ 线 程 一 休眠 结束 ， 结 束 于 : 18-27-11 20:27:56 
3 所 有 线程 结束 时 间 : 18-27-11 20:27:58 


_thread 模块 提供 了 简单 的 多 线程 机 制 ， 两 个 循环 并 发 执行 ， 总 的 运行 时 间 为 最 慢 的 线程 的 运 
线程 68) ， 而 不 是 所 有 线程 的 运行 时 间 之 和 。start_new_thread0 要 求 至 少 传 两 个 参数 ， 








即使 想 要 运行 的 函数 不 要 参数 ， 也 要 传 一 个 空 元 组 。 


sleep(6) 是 让 主线 程 停 下 来 。 主 线程 一 旦 运行 结束 ， 就 关闭 运行 着 的 其 他 两 个 线程 。 这 可 能 造 


成 主线 程 过 早 或 过 晚 退出 ， 这 时 就 要 使 用 线程 锁 ， 主 线程 可 以 在 两 个 子 线程 都 退出 后 立即 退出 。 


示例 代码 如 下 (exp_thread 2.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*— 


import _thread 
from time import sleep 
from datetime import datetime 


loops = [4, 2] 
date time format = 1%Y-%M-%d S$H:$M:%S" 


def date time str(date time): 
return datetime.strftime (date time, date time format) 


def loop(n loop, n sec, lock): 
print (f' 线 程 ( {n_loop} ) 开始 执行 : {date_time str (datetime .now() )}， 先 休 卢 ({n_sec}) 秒 ') 
sleep(n sec) 
print (f' 线 程 ( {n_loop} ) 休眠 结束 ， 结 束 于 : {date time str(datetime.now())}"') 
lock. release () 
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上 


日 





月 


def main() : 
Print ("--- 所 有 线程 开始 执行 . . . ') 
locks = [] 
n_loops = range(len(loops)) 


for i in n loops: 
lock = thread.allocate lock() 
lock.acquire() 
locks.append (lock) 


for i in n loops: 
_thread.start new thread(loop, (i, loops[i], locks[i])) 


for i in n loops: 
while locks[i].locked(): pass 


print (f'--- 所 有 线程 执行 结束 : {date_ time_ str (datetime.now())}') 
if name =="' main _': 

main() 
执行 结果 如 下 : 


--- 所 有 线程 开始 执行 .. . 

线程 ( 1 ) 开始 执行 : 18-28-11 20:28:20 ， 先 休眠 〈 2 ) 秒 
线程 ( 0 ) 开始 执行 : 18-28-11 20:28:20 ， 先 休眠 ( 4 ) 秒 
线程 ( 1 ) 休眠 结束 ， 结 束 于 : 18-28-11 20:28:22 

线程 ( 0 ) 休 卢 结束， 结束 于 : 18-28-11 20:28:24 

--- 所 有 线程 执行 结束 : 18-28-11 20:28:24 


可 以 看 到 ， 以 上 代码 使 用 了 线程 锁 。 
13.4 threading 模块 


更 高 级 别 的 threading 模块 不 仅 提供 了 Thread 类 ， 还 提供 了 各 种 非常 好 用 的 同步 机 制 。 

_thread 模块 不 支持 守护 线程 ， 当 主线 程 退出 时 ， 所 有 子 线程 无 论 是 否 在 工作 ， 都 会 被 强行 退 
上 。threading 模块 支持 守护 线程 ， 守 护 线程 一 般 是 一 个 等 待 客户 请 求 的 服务 器 ， 如 果 没 有 客户 提 
请求 ， 就 一 直 等 着 。 如 果 设 定 一 个 线程 为 守护 线程 ， 就 表示 这 个 线程 不 重要 ， 在 进程 退出 时 ， 不 
等 待 这 个 线程 退出 。 如 果 主 线程 退出 时 不 用 等 待 子 线程 完成 , 就 要 设 定 这 些 线程 的 daemon 属性 ， 
在 线程 Thread.start() 开始 前 ， 调 用 setDaemon() 函数 设 定 线 程 的 daemon 标志 
(Thread.setDaemon(True)) ， 表 示 这 个 线程 “不 重要 ”。 如 果 一 定 要 等 待 子 线程 执行 完成 再 退出 
线程 ， 就 什么 都 不 用 做 或 显 式 调用 Thread.setDaemon(False) 以 保证 daemon 标志 为 False， 可 以 调 
日 Thread.isDaemon() 函 数 判断 daemon 标志 的 值 。 新 的 子 线程 会 继承 父 线程 的 daemon 标志 ， 主 线 


程 在 所 有 非 守 护 线程 退出 后 才 会 结束 ， 即 进程 中 没有 非 守 护 线程 存在 时 才 结 束 。 


※ threading 的 Thread 类 


Thread 有 很 多 _thread 模块 里 没有 的 函数 ，Thread 对 象 的 函数 很 丰富 。 下 面 创建 一 个 Thread 的 
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实例 ， 传 给 它 一 个 函数 。 示 例如 下 (exp_thread 3.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


import threading 
from time import sleep 
from datetime import datetime 


loops = [4, 2] 
date time format = '%y-%M-%d %H:%M:%S' 


def date time str(date time): 
return datetime.strftime (date time, date time format) 


def loop(n loop, n_ sec): 
print (f' 线 程 ( {n_loop} ) 开始 执行 : {date_time_str (datetime .now() )}， 先 休 卢 ({n_sec}) 秒 ') 
sleep(n sec) 
print (f' 线 程 (fn_loop} ) 休眠 结束 ， 结 束 于 : {date time str(datetime.now())}') 


def main(): 
print (f'--- 所 有 线程 开始 执行 : {date_time_ str (datetime.now())}') 
threads = [] 
n_loops = range (len (loops)) 


for i in n loops: 
t = threading.Thread (target=loop, args=(i, loops[i])) 
threads .append(t) 


for i in n loops: # start threads 
threads [i] .start () 


for i in n loops: # wait for all 
threads [i] .join() # threads to finish 


print (f'--- 所 有 线程 执行 结束 于 : {date_time str (datetime.now())}') 


if name =="' main _'; 
main() 
执行 结果 如 下 : 


--- 所 有 线程 开始 执行 : 18-29-11 20:29:30 

线程 ( 0 ) 开始 执行 : 18-29-11 20:29:30 ， 先 休眠 ( 4 ) 秒 

线程 ( 1 ) 开始 执行 : 18-29-11 20:29:30 ， 先 休眠 〈( 2 ) 秒 

线程 ( 1 ) 休眠 结束 ， 结 束 于 : 18-29-11 20:29:32 

线程 ( 0 ) 休眠 结束 ， 结 束 于 : 18-29-11 20:29:34 

--- 所 有 线程 执行 结束 于 : 18-29-11 20:29:34 

由 执行 结果 我 们 看 到 ， 实 例 化 一 个 Thread (调用 Thread()) 与 调用 _thread.start new _thread() 
最 大 的 区 别 是 新 的 线程 不 会 立即 开始 。 创 建 线程 对 象 却 不 想 马 上 开始 运行 线程 时 ，Thread 是 一 个 
很 有 用 的 同步 特性 。 所 有 线程 都 创建 之 后 , 再 一 起 调用 start(0) 函 数 启动 , 而 不 是 每 创建 一 个 线程 就 启动 。 
而 且 不 用 管理 一 堆 锁 的 状态 〈 分 配 锁 、 获 得 锁 、 释 放 锁 、 检 查 锁 的 状态 等 ) ， 只 要 简单 对 每 个 线程 调 
用 join0 主 线程 ， 等 待 子 线程 结束 即 可 。join0 还 可 以 设置 timeout 参数 ， 即 主线 程 的 超时 时 间 。 











第 13 章 多 线程 | 263 


join0 另 一 个 比较 重要 的 方面 是 可 以 完全 不 用 调用 。 一 旦 线程 启动 ， 就 会 一 直 运 行 ， 直 到 线程 
的 函数 结束 并 退出 为 止 。 如 果 主 线程 除了 等 线程 结束 外 ， 还 有 其 他 事情 要 做 ， 就 不 用 调用 join()， 
只 有 在 等 待 线程 结束 时 才 调 用 。 

我 们 再 看 一 个 示例 ， 创 建 一 个 Thread 的 实例 ， 并 传 给 它 一 个 可 调用 的 类 对 象 。 代 码 如 下 
(thread func.py) : 
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join0 另 一 个 比较 重要 的 方面 是 可 以 完全 不 用 调用 。 一 旦 线程 启动 ， 就 会 一 直 运 行 ， 直 到 线程 
的 函数 结束 并 退出 为 止 。 如 果 主 线程 除了 等 线程 结束 外 ， 还 有 其 他 事情 要 做 ， 就 不 用 调用 join()， 
只 有 在 等 待 线程 结束 时 才 调 用 。 

我 们 再 看 一 个 示例 ， 创 建 一 个 Thread 的 实例 ， 并 传 给 它 一 个 可 调用 的 类 对 象 。 代 码 如 下 
(thread func.py) : 
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执行 结果 如 下 : 


--- 所 有 线程 开始 执行 : 18-29-11 20:29:53 

线程 ( 0 ) 开始 执行 : 18-29-11 20:29:53 ， 先 休眠 〈 4 ) 秒 
线程 ( 1 ) 开始 执行 : 18-29-11 20:29:53 ， 先 休眠 〈 2 ) 秒 
线程 ( 1 ) 休眠 结束 ， 结 束 于 : 18-29-11 20:29:55 

线程 ( 0 ) 休眠 结束 ， 结 束 于 : 18-29-11 20:29:57 

--- 所 有 线程 执行 结束 于 : 18-29-11 20:29:57 


由 执行 结果 看 到 ， 与 传 一 个 函数 很 相似 的 一 个 方法 是 ， 在 创建 线程 时 ， 传 一 个 可 调用 的 类 的 
实例 供 线程 启动 时 执行 ， 这 是 多 线程 编程 的 一 个 面向 对 象 的 方法 。 相 对 于 一 个 或 几 个 函数 来 说 ， 类 
对 象 可 以 使 用 类 的 强大 功能 。 创 建新 线程 时 ，Thread 对 象 会 调用 ThreadFunc 对 象 ， 这 时 会 用 到 一 
个 特殊 函数 _call_()。 由 于 已 经 有 了 要 用 的 参数 ， 因 此 不 用 再 传 到 Thread() 的 构造 函数 中 。 对 于 有 
一 个 参数 的 元 组 ， 要 使 用 self.func(*self.args) 方 法 。 

从 Thread 派生 一 个 子 类 ， 创 建 这 个 子 类 的 实例 。 从 上 面 的 代码 派生 的 代码 如 下 
(my_thread 1.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*-— 


import threading 
from time import sleep 
from datetime import datetime 


loops = [4, 2] 
date time format = '%y-%M-%d %H:%M:%S" 


class MyThread (threading.Thread): 
def _init_ (self, func, args, name=''): 
threading.Thread. init (self) 
self.name = name 
self.func = func 
self.args = args 


def getResult (self): 
return self.res 


def run(self) : 
print(f'starting {self.name} at:{date time str(datetime.now())}') 
self.res = self.func(*self.args) 
print(f'{self.name} finished at:{date time str(datetime.now())}') 


def date time str(date time) : 
return datetime.strftime (date time, date time format) 

def loop(n loop, n sec) 
print (f' 线 程 ({n 5 开始 执行 : {date time str(datetime.now())}， 先 休眠 ({n sec}) 秒 ') 


sleep(n sec) 
print (f' 线 程 ({n loop}) 休眠 结束 ， 结 束 于 : {date time str(datetime.now())}') 


def main () : 
print (f'--- 所 有 线程 开始 执行 : {date time str (datetime.now())}') 
threads = [] 
n_loops = range (len (loops)) 


for i in n_ loops: 
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t = MyThread (loop, (i, loops[i]), 
loop. name ) 
threads .append (t) 


for i in n_loops: 
threads [i] .start () 


for i in n loops: 
threads [i] .join() 


print (f'--- 所 有 线程 执行 结束 于 : {date time str (datetime.now())}') 
if name =="' main _': 

main() 
执行 结果 如 下 : 


--- 所 有 线程 开始 执行 : 18-26-11 20:26:48 

starting loop at: 18-26-11 20:26:48 

线程 ( 0 ) 开始 执行 : 18-26-11 20:26:48starting ， 先 休眠 ( 4 loop at: 18-26-11 20:26:48 
线程 ( 1 ) 开始 执行 : 18-26-11 20:26:48 ， 先 休眠 〈 2 ) 秒 ) 秒 


线程 ( 1 ) 休眠 结束 ， 结 束 于 : 18-26-11 20:26:50 

loop finished at: 18-26-11 20:26:50 

线程 ( 0 ) 休眠 结束 ， 结 束 于 : 18-26-11 20:26:52 

loop finished at: 18-26-11 20:26:52 

--- 所 有 线程 执行 结束 于 : 18-26-11 20:26:52 

由 代码 片段 和 执行 结果 我 们 看 到 , 子 类 化 Thread 类 , MyThread 子 类 的 构造 函数 一 定 要 先 调用 
基 类 的 构造 函数 ， 特 殊 函 数 _call_() 在 子 类 中 ， 名 字 要 改 为 run()。 在 MyThread 类 中 加 入 一 些 用 
于 调试 的 输出 信息 ， 把 代码 保存 到 MyThread 模块 中 ， 并 导入 这 个 类 。 使 用 selffunc0 函 数 运行 这 
些 函 数 ， 并 把 结果 保存 到 实现 的 selfres 属性 中 ， 创 建 一 个 新 函数 getResult() 得 到 结果 。 


13.5 “线程 同步 


如 果 多 个 线程 共同 修改 某 个 数据 ， 就 可 能 会 出 现 不 可 预料 的 结果 。 为 了 保证 数据 的 正确 性 ， 
需要 对 多 个 线程 进行 同步 。 

使 用 Thread 对 象 的 Lock 和 RLock 可 以 实现 简单 的 线程 同步 , 这 两 个 对 象 都 有 acquire 方法 和 
release 方法 。 对 于 每 次 只 允许 一 个 线程 操作 的 数据 ， 可 以 将 操作 放 到 acquire 和 release 方法 之 间 。 

多 线程 的 优势 在 于 可 以 同时 运行 多 个 任务 ， 但 当 线 程 需要 共享 数据 时 ， 可 能 存在 数据 不 同步 
的 问题 。 

考虑 这 样 一 种 情况 : 一 个 列表 里 所 有 元 素 都 是 0， 线 程 set 从 后 向 前 把 所 有 元 素 改 成 1， 而 线 
程 print 负责 从 前 往 后 读 取 列 表 并 输出 。 

线程 set 开始 改 的 时 候 ， 线 程 print 可 能 就 来 输出 列表 了 ， 输 出 就 成 了 一 半 0 一 半 1， 这 就 是 数 
据 不 同步 的 问题 。 为 了 避免 这 种 情况 ， 引 入 了 锁 的 概念 。 

锁 有 两 种 状态 一 一 锁定 和 未 锁定 。 当 一 个 线程 (如 set) 要 访问 共享 数据 时 ， 必 须 先 获得 锁定 ; 
如 果 已 经 有 别 的 线程 (如 print) 获得 锁定 了 ， 就 让 线程 set 暂停 ， 也 就 是 同步 阻塞 ; 等 到 线程 print 
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访问 完毕 ， 释 放 锁 以 后 ， 再 让 线程 set 继续 。 

经 过 这 样 的 处 理 ， 输 出 列表 时 要 么 全 部 输出 0， 要 么 全 部 输出 1， 不 会 再 出 现 一 半 0 一 半 1 的 
尴 傣 场面 。 

示例 代码 如 下 (my thread 2.py) : 
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Print (" 退 出 主线 程 ") 


if name 
threagLock = threading.Lock() 
threads = [] 


main() 
执行 结果 如 下 : 


开启 线程 : 

开启 线程 : 

Thread-1: 
Thread-1: 
Thread-1: 
Thread-2: 
Thread-2: 
Thread-2: 
退出 主线 程 


由 执行 结果 看 到 ， 程 序 正确 得 到 了 同步 效果 。 


== " main "; 


Thread-1 

Thread-2 
18-30-11 
18-30-11 
18-30-11 
18-30-11 
18-30-11 
18-30-11 


20: 
20: 
20: 
20: 
20: 
20: 


13.6 ”线程 优先 级 队列 


Queue 模块 可 以 用 来 进行 线程 间 的 通信 ， 让 各 个 线程 之 间 共 享 数据 。 
Python 的 Queue 模块 提供 了 同步 的 、 线 程 安全 的 队列 类 , 包括 FIFO〈 先 入 先 出 ) 队列 Queue、 


LIFO〔〈 后 入 先 出 ) 队列 LifoQueue 和 优先 级 队列 PriorityQueue。 这 些 队 列 都 实现 了 锁 原 语 ， 


能 够 在 


多 线程 中 直接 使 用 。 可 以 使 用 队列 实现 线程 间 的 同步 。 
Queue 模块 中 的 常用 方法 如 表 13-1 所 示 。 


表 13-1 Queue 模块 中 的 常用 方法 



































方法 名 描述 

qsize() 返回 队列 的 大 小 

empty0 如 果 队 列 为 室 ， 返 回 Tmue， 和 否则 返回 False 
full) 如 果 队列 满 了 ， 返 回 Tme， 否 则 返回 False 
ful 与 MaxSize 大 小 对 应 

get([block[, timeout]]) 获取 队列 ，timeout 等 待 时 间 

get_nowait() 相当 于 Queue.get(False) 

put(timeout) 写 入 队列 ，timeout 等 待 时 间 

put_nowait(item) 相当 于 Queue.put(item, False) 

task_doneO 在 完成 一 项 工作 后 ， 函 数 向 已 经 完成 的 队列 发 送 一 个 信号 
join0 实际 上 意味 着 等 到 队列 为 定 ， 再 执行 别 的 操作 


下 面 通过 示例 了 解 其 中 一 些 方法 的 使 用 (my_thread 3.py) 。 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 
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exitFlag = 1 


# 等 待 所 有 线程 完成 

for t in threads: 
t.join() 

print ("退出 主线 程 ") 


if name ==" main ": 
queueLock = threading.Lock() 
workQueue = queue.Queue(10) 
main() 


执行 结果 如 下 : 


开启 线程 : Thread-1 

开启 线程 : Thread-2 

开启 线程 : Thread-3 

Thread-2 processing One 

Thread-3 processing Two 

Thread-1 processing Three 

Thread-3 processing FourThread-2 processing Five 
退出 线程 ，Thread-1 


退出 线程 ，Thread-3 
退出 线程 ， Thread-2 
退出 主线 程 


13.7 ”线程 与 进程 比较 


多 进程 和 多 线程 是 实现 多 任务 常用 的 两 种 方式 。 下 面 从 线程 切换 、 计算 密集 情况 和 异步 性 能 3 
方面 讨论 一 下 这 两 种 方式 的 优 缺 点 。 

首先 ， 要 实现 多 任务 ， 我 们 通常 会 设计 Master-Worker 模式 ，Master 负责 分 配 任务 ，Worker 
负责 执行 任务 。 因 此 ， 在 多 任务 环境 下 ， 通 常 是 一 个 Master、 多 个 Worker。 

如 果 用 多 进程 实现 Master-Worker， 主 进程 就 是 Master， 其 他 进程 就 是 Worker。 

如 果 用 多 线程 实现 Master-Worker， 主 线程 就 是 Master， 其 他 线程 就 是 Worker。 

多 进程 模式 最 大 的 优点 是 稳定 性 高 ， 因 为 一 个 子 进 程 崩 溃 不 会 影响 主 进程 和 其 他 子 进程 〈 当 
然 ， 主 进程 挂 了 所 有 进程 就 全 挂 了 ， 但 是 Master 进程 只 负责 分 配 任务 ， 挂 掉 的 概率 低 ) 。 著 名 的 
Apache 最 早 就 采用 多 进程 模式 。 

多 进程 模式 的 缺点 是 创建 进程 的 代价 大 。 在 UNIX/Linux 系统 下 用 fork 调用 还 行 , 在 Windows 
系统 下 创建 进程 开销 非常 大 。 另 外 ,操作 系统 能 同时 运行 的 进程 数 有 限 , 在 内 存 和 CPU 的 限制 下 ， 
如 果 几 千 个 进程 同时 运行 ， 操 作 系 统 就 连 调度 都 会 出 问题 。 

多 线程 模式 通常 比 多 进程 快 一 点 ， 但 是 也 快 不 了 多 少 。 多 线程 模式 致命 的 缺点 是 任何 一 个 线 
程 挂 掉 都 可 能 直接 造成 整个 进程 骨 江 ， 因 为 所 有 线程 共享 进程 的 内 存 。 在 Windows 系统 中 ， 如 果 
一 个 线程 执行 的 代码 出 了 问题 ， 就 可 以 看 到 这 样 的 提示 : “该 程序 执行 了 非法 操作 ， 即 将 关闭 ”， 
实 往 往 是 某 个 线程 出 了 问题 ， 但 是 操作 系统 会 强制 结束 整个 进程 。 
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在 Windows 系统 中 ， 多 线程 的 效率 比 多 进程 高 ， 所 以 微软 的 IIS 服务 器 默认 采用 多 线程 模式 。 
由 于 多 线程 存在 稳定 性 的 问题 ， 因 此 IIS 的 稳定 性 不 如 Apache。 为 了 缓解 这 个 问题 ，IIS 和 Apache 
有 了 多 进程 + 多 线程 的 混合 模式 ， 问 题 越 来 越 复杂 。 





13.7.1 ”线程 切换 


无 论 是 多 进程 还 是 多 线程 ， 数 量 太 多 ， 效 率 肯定 上 不 去 。 

我 们 打 个 比方 ， 你 正在 准备 中 考 ， 每 天 晚上 需要 做 语文 、 数 学 、 英 语 、 物 理 、 化 学 5 科 作 业 ， 
每 科 作 业 耗 时 1 小 时 。 

如 果 你 先 花 1 小 时 做 语文 作业 ， 做 完 后 再 花 1 小 时 做 数学 作业 ， 这 样 依次 全 部 做 完 ， 一 共 花 5 
小 时 ， 这 种 方式 称 为 单 任务 模型 或 批 处 理 任务 模型 。 

如 果 你 打算 切换 到 多 任务 模型 ， 可 以 先 做 1 分 钟 语文 ， 切 换 到 数学 作业 做 1 分 钟 ， 再 切换 到 
英语 ， 以 此 类 推 ， 只 要 切换 速度 足够 快 ， 这 种 方式 就 和 单 核 CPU 执行 多 任务 一 样 了 。 以 幼儿 园 小 
朋友 的 眼光 来 看 ， 你 就 正在 同时 写 5 科 作业 。 

不 过 切换 作业 是 有 代价 的 ， 比 如 从 语文 切换 到 数学 ， 要 先 收拾 桌子 上 的 语文 书本 、 钢 笔 《〈 保 
存 现 场 ) ， 然 后 打开 数学 课本 ， 找 出 圆规 和 直 尺 〈 准 备 新 环境 ) ， 才 能 开始 做 数学 作业 。 操 作 系 统 
在 切换 进程 或 线程 时 也 一 样 ， 需 要 先 保存 当前 执行 的 现场 环境 (CPU 寄存 器 状态 、 内 存 页 等 ) ， 
然后 把 新 任务 的 执行 环境 准备 好 (恢复 上 次 的 寄存 嚣 状态、 切换 内 存 页 等 )， 才 能 开始 执行 。 这 个 
切换 过 程 虽然 很 快 , 但 是 也 需要 耗费 时 间 。 如 果 有 几 千 个 任务 同时 进行 , 操作 系统 可 能 主要 忙 着 切 
换 任务 , 根本 没有 多 少时 间 执 行 任务 。 这 种 情况 常见 的 就 是 硬盘 狂 响 、 点 窗口 无 反应 ， 这 时 系统 处 
于 假死 状态 。 

所 以 ， 多 任务 一 旦 多 到 一 个 限度 ， 就 会 消耗 系统 所 有 资源 ， 导 致 效率 急剧 下 降 ， 所 有 任务 都 
做 不 好 。 


13.7.2 ”计算 密集 型 与 IO 密集 型 


是 否 采用 多 任务 的 第 二 个 考虑 是 任务 类 型 。 我 们 可 以 把 任务 分 为 计算 密集 型 和 IO 密集 型 。 

计算 密集 型 任务 的 特点 是 要 进行 大 量 计算 ， 消 耗 CPU 资源 ， 如 计算 圆周 率 、 对 视频 进行 高 清 
解码 等 ， 全 靠 CPU 的 运算 能 力 。 计 算 密集 型 任务 虽然 可 以 用 多 任务 完成 ， 但 是 任务 越 多 ， 花 在 任 
务 切换 的 时 间 就 越 多 ，CPU 执行 任务 的 效率 就 越 低 。 要 最 高 效 地 利用 CPU， 计 算 密集 型 任务 同时 
进行 的 数量 应 当 等 于 CPU 的 核心 数 。 

由 于 计算 密集 型 任务 时 主要 消耗 CPU 资源 ， 因 此 代码 运行 效率 至 关 重要 。Python 脚本 语言 运 
行 效率 很 低 ， 完 全 不 适合 计算 密集 型 任务 。 计 算 密集 型 任务 最 好 用 C 语言 编写 。 

涉及 网 络 、 磁 盘 IO 的 任务 都 是 IO 密集 型 任务 ， 这 类 任务 的 特点 是 CPU 消耗 很 少 ， 任 务 的 大 
部 分 时 间 都 在 等 待 IO 操作 完成 (因为 IO 的 速度 远 远 低 于 CPU 和 内 存 的 速度 ) 。IO 密集 型 任务 的 
任务 越 多 ，CPU 效率 越 高 ， 不 过 有 一 个 限度 。 大 部 分 任务 都 是 IO 密集 型 任务 ， 如 Web 应 用 。 

IO 密集 型 任务 执行 期 间 ，99% 的 时 间 都 花 在 IO 上 ， 花 在 CPU 上 的 时 间 很 少 ， 因 此 用 运行 速 
度 极 快 的 C 语言 蔡 换 Python 这 样 运行 速度 极 低 的 脚本 语言 完全 无 法 提升 运行 效率 。 对 于 IO 密集 
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在 Windows 系统 中 ， 多 线程 的 效率 比 多 进程 高 ， 所 以 微软 的 IIS 服务 器 默认 采用 多 线程 模式 。 
由 于 多 线程 存在 稳定 性 的 问题 ， 因 此 IIS 的 稳定 性 不 如 Apache。 为 了 缓解 这 个 问题 ，IIS 和 Apache 
有 了 多 进程 + 多 线程 的 混合 模式 ， 问 题 越 来 越 复杂 。 





13.7.1 ”线程 切换 


无 论 是 多 进程 还 是 多 线程 ， 数 量 太 多 ， 效 率 肯定 上 不 去 。 

我 们 打 个 比方 ， 你 正在 准备 中 考 ， 每 天 晚上 需要 做 语文 、 数 学 、 英 语 、 物 理 、 化 学 5 科 作 业 ， 
每 科 作 业 耗 时 1 小 时 。 

如 果 你 先 花 1 小 时 做 语文 作业 ， 做 完 后 再 花 1 小 时 做 数学 作业 ， 这 样 依次 全 部 做 完 ， 一 共 花 5 
小 时 ， 这 种 方式 称 为 单 任务 模型 或 批 处 理 任务 模型 。 

如 果 你 打算 切换 到 多 任务 模型 ， 可 以 先 做 1 分 钟 语文 ， 切 换 到 数学 作业 做 1 分 钟 ， 再 切换 到 
英语 ， 以 此 类 推 ， 只 要 切换 速度 足够 快 ， 这 种 方式 就 和 单 核 CPU 执行 多 任务 一 样 了 。 以 幼儿 园 小 
朋友 的 眼光 来 看 ， 你 就 正在 同时 写 5 科 作业 。 

不 过 切换 作业 是 有 代价 的 ， 比 如 从 语文 切换 到 数学 ， 要 先 收拾 桌子 上 的 语文 书本 、 钢 笔 《〈 保 
存 现 场 ) ， 然 后 打开 数学 课本 ， 找 出 圆规 和 直 尺 〈 准 备 新 环境 ) ， 才 能 开始 做 数学 作业 。 操 作 系 统 
在 切换 进程 或 线程 时 也 一 样 ， 需 要 先 保存 当前 执行 的 现场 环境 (CPU 寄存 器 状态 、 内 存 页 等 ) ， 
然后 把 新 任务 的 执行 环境 准备 好 (恢复 上 次 的 寄存 嚣 状态、 切换 内 存 页 等 )， 才 能 开始 执行 。 这 个 
切换 过 程 虽然 很 快 , 但 是 也 需要 耗费 时 间 。 如 果 有 几 千 个 任务 同时 进行 , 操作 系统 可 能 主要 忙 着 切 
换 任务 , 根本 没有 多 少时 间 执 行 任务 。 这 种 情况 常见 的 就 是 硬盘 狂 响 、 点 窗口 无 反应 ， 这 时 系统 处 
于 假死 状态 。 

所 以 ， 多 任务 一 旦 多 到 一 个 限度 ， 就 会 消耗 系统 所 有 资源 ， 导 致 效率 急剧 下 降 ， 所 有 任务 都 
做 不 好 。 


13.7.2 ”计算 密集 型 与 IO 密集 型 


是 否 采用 多 任务 的 第 二 个 考虑 是 任务 类 型 。 我 们 可 以 把 任务 分 为 计算 密集 型 和 IO 密集 型 。 

计算 密集 型 任务 的 特点 是 要 进行 大 量 计算 ， 消 耗 CPU 资源 ， 如 计算 圆周 率 、 对 视频 进行 高 清 
解码 等 ， 全 靠 CPU 的 运算 能 力 。 计 算 密集 型 任务 虽然 可 以 用 多 任务 完成 ， 但 是 任务 越 多 ， 花 在 任 
务 切换 的 时 间 就 越 多 ，CPU 执行 任务 的 效率 就 越 低 。 要 最 高 效 地 利用 CPU， 计 算 密集 型 任务 同时 
进行 的 数量 应 当 等 于 CPU 的 核心 数 。 

由 于 计算 密集 型 任务 时 主要 消耗 CPU 资源 ， 因 此 代码 运行 效率 至 关 重要 。Python 脚本 语言 运 
行 效率 很 低 ， 完 全 不 适合 计算 密集 型 任务 。 计 算 密集 型 任务 最 好 用 C 语言 编写 。 

涉及 网 络 、 磁 盘 IO 的 任务 都 是 IO 密集 型 任务 ， 这 类 任务 的 特点 是 CPU 消耗 很 少 ， 任 务 的 大 
部 分 时 间 都 在 等 待 IO 操作 完成 (因为 IO 的 速度 远 远 低 于 CPU 和 内 存 的 速度 ) 。IO 密集 型 任务 的 
任务 越 多 ，CPU 效率 越 高 ， 不 过 有 一 个 限度 。 大 部 分 任务 都 是 IO 密集 型 任务 ， 如 Web 应 用 。 

IO 密集 型 任务 执行 期 间 ，99% 的 时 间 都 花 在 IO 上 ， 花 在 CPU 上 的 时 间 很 少 ， 因 此 用 运行 速 
度 极 快 的 C 语言 蔡 换 Python 这 样 运行 速度 极 低 的 脚本 语言 完全 无 法 提升 运行 效率 。 对 于 IO 密集 
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型 任务 而 言 ， 最 适合 的 语言 是 开发 效率 高 〈 代 码 量 最 少 ) 的 语言 ， 脚 本 语言 是 首选 ，C 语言 最 差 。 
13.7.3 ”异步 10 


考虑 到 CPU 和 IO 之 间 速 度 差异 很 大 ， 一 个 任务 在 执行 的 过 程 中 大 部 分 时 间 都 在 等 待 IO 操作 ， 单 
进程 单线 程 模型 会 导致 别 的 任务 无 法 并 行 执行 , 因此 需要 多 进程 模型 或 多 线程 模型 支持 多 任务 并 发 执行 。 

现在 的 操作 系统 对 IO 操作 已 经 做 了 很 大 改进 , 最 大 的 特点 是 支持 异步 IO。 如 果 充 分 利用 操作 
系统 提供 的 异步 IO 支持 ， 就 可 以 用 单 进程 单线 程 模型 执行 多 任务 ， 这 种 全 新 模型 称 为 事件 驱动 模 
型 。Nginx 就 是 支持 异步 IO 的 Web 服务 器 ， 在 单 核 CPU 上 采用 单 进程 模型 就 可 以 高 效 支持 多 任 
务 ; 在 多 核 CPU 上 可 以 运行 多 个 进程 (数量 与 CPU 核心 数 相同 ) ， 充 分 利用 多 核 CPU。 由 于 系 
统 总 的 进程 数量 十 分 有 限 ， 因 此 操作 系统 调度 非常 高 效 。 用 异步 IO 编程 模型 实现 多 任务 是 主要 趋势 。 

对 应 到 Python 语言 ， 单 进程 的 异步 编程 模型 称 为 协 程 。 有 了 协 程 的 支持 ， 可 以 基于 事件 驱动 
编写 高 效 的 多 任务 程序 。 





13.8 牛刀 小 多 线程 简单 怜 虫 


结合 本 章 所 学 写 一 个 多 线程 函数 ， 实 现 以 不 阻塞 多 线程 的 方式 从 一 个 指定 网 页 抓 取 网 页 链接 ， 
并 打印 各 个 线程 执行 网 页 的 情况 和 总 耗 时 。 

思维 点 拨 : 

(1) URL 拼接 : (2) 多 线程 构造 ， 〈3) 不 阻塞 的 实现 ，〈4) 总 时 间 打 印 ， 实 现 需 要 用 到 
之 前 未 讲解 过 的 知识 点 ， 即 urllib 库 。 

一 个 简单 实现 示例 如 下 (thread_fetch_url.py》: 


# coding=utf-8 
import threading, queue, time, urllib 
from urllib import request 


BASE_URL = 'http://www.pythontab.com/html/pythonjichu/' 
URL QUEUE = queue.Queue() 
for item in range(2, 10): 

url = BASE URL + str(item) + '.html' 

URL_QUEUE .put (url) 


def fetch url (url queue): 
while True: 
try: 
# 不 阻塞 的 读 取 队列 数据 
Url val = url queue.get nowait() 
url_queue.qsize() 
except Exception as ex: 
print(f'ex info is:{ex}') 
break 
curr thread name = threading.currentThread() .name 
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if 


在 多 线程 的 调试 过 程 中 ， 可 能 无 论 怎么 努力 也 找 不 到 问题 所 在 。 即 使 是 最 好 的 程序 员 偶尔 也 会 
卡 住 。 有 时 候 在 一 段 程序 上 工作 太 久 反而 看 不 到 错误 ， 这 时 可 能 需要 从 新 的 角度 审视 问题 。 

当然 ， 在 找到 切入 点 之 前 ， 需 要 提前 做 好 准备 工作 。 你 的 程序 应 当 尽 量 简 单 ， 并 且 能 够 使 用 
最 少 的 输入 复 现 错误 。 你 应 当 足 够 理解 遇 到 的 问题 ， 并 能 简明 扼要 地 描述 问题 。 


print(f'Current Thread Name {curr thread name}, Url: {url vall " 


ry 
response = urllib.request.urlopen(url val) 
response code = response.getcode () 
except Exception as ep: 
print(f'xp info is:{ep}') 
continue 
if response code == 200: 
# 抓 取 内 容 的 数据 处 理 放 这 里 
# 为 了 突出 效果 ， 设 置 延 时 
time.sleep(1) 


_name =="' main _': 

start time = time.time() 

threads = [] 

# 可 以 调节 线程 数 ， 进 而 控制 抓 取 速 度 

thread num = 4 

for num in range(0，thread_num) : 
thread = threading.Thread(target=fetch url, args=(URL QUEUE,)) 
threads .append (thread) 

for item t in threads: 
item t.start() 

for thread t in threads: 


# 多 线程 多 join， 依 次 执行 各 线程 的 join 方法 ， 确 保 主 线程 最 后 退出 ， 线 程 间 没有 阻塞 


thread t.join() 
Print (f£'All thread done, spend: {(time.time() - start time)} s') 


13.9 调 试 


在 寻找 切入 点 时 ， 请 确保 可 以 提供 以 下 信息 


(1) 如 果 有 错误 信息 ， 错 误 信息 是 什么 ， 代 表 程 序 哪 部 分 内 容 ? 
(2) 在 这 个 错误 之 前 ， 你 做 的 最 后 一 件 事 情 是 什么 ? 

(3) 你 写 的 最 后 一 段 代码 是 怎样 的 ? 

(4) 失败 的 新 测试 用 例 是 怎样 的 ? 

(5) 目前 你 做 了 哪些 尝试 ， 从 中 得 到 了 什么 ? 


在 寻找 解决 问题 的 方案 时 ， 思 考 如 何 做 才能 找 得 更 快 。 下 次 遇 到 类 似 问题 时 才能 快速 找到 最 


优 的 解决 办 法 。 


记 住 ， 我 们 的 目标 不 是 让 程序 正确 运行 ， 而 是 学 会 让 程序 在 尽 可 能 短 的 时 间 内 正确 运行 起 来 ， 


并 尽量 少 出 问题 。 
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13.10 ”问题 解答 


(1) Python 多 线程 的 效率 怎么 样 ? 

答 : Python 有 全 锁 局 的 存在 (同一 时 间 只 能 有 一 个 线程 执行 )， 并 不 能 利用 多 核 优 势 。 如 果 
你 的 多 线程 进程 是 CPU 密集 型 的 ， 多 线程 就 不 能 带 来 效率 的 提升 ， 相 反 还 可 能 因为 线程 的 频繁 切 
换 导致 效率 下 降 。 如 果 是 IO 密集 型 ， 多 线程 进程 就 可 以 利用 IO 阻塞 等 待 时 的 空闲 时 间 执 行 其 他 
线程 ， 从 而 提升 效率 。 

(2) 既然 Python 解释 器 是 单线 程 的 ， 还 有 进行 多 线程 编程 的 必要 吗 ? 

答 : 多 线程 最 开始 不 是 用 来 解决 多 核 利用 率 问题 的 ， 而 是 用 来 解决 IO 占用 时 CPU 闲置 的 问 
题 。 

多 线程 可 以 用 来 解决 阻塞 问题 ， 可 以 做 事件 响应 机 制 〈 或 者 类 似 信号 槽 的 问题 )》 。 如 果 运 行 
瓶颈 不 是 在 CPU 运算 而 是 在 IO〈 网 络 ) 上 ， 多 线程 显然 很 划算 。 

能 产生 IO 阻塞 的 情况 很 多 ， 如 网 络 、 磁 盘 等 。 当 发 生 阻 塞 时 ，Python 是 不 耗 CPU 的 ， 此 时 
如 果 只 有 一 个 线程 就 没 法 处 理 其 他 事情 了 。 对 于 有 IO 阻塞 的 环境 ， 多 线程 可 能 让 你 的 CPU 跑 到 
100%。 

另 一 个 用 处 来 自 于 Python 的 C 扩展 模块 。 在 扩展 模块 里 可 以 释放 GIL。 释 放 GIL 期 间 不 
应 该 调用 任何 Python API。 对 于 一 些 非常 繁重 的 计算 ， 可 以 写成 C 模块 ， 计 算 前 释放 GIL， 计 
算 后 重新 申请 GIL， 并 将 结果 返回 给 Python。 这 样 就 可 以 让 Python 进程 利用 更 多 CPU 资源 。 
每 个 Python 线程 都 是 OS 级别 的 Pthread 线 程 .利用 Python 管理 这 些 线程 比 在 C 层级 操作 Pthread 
更 方便 。 





13.11 温 故 知 新 ， 学 以 致 用 


: 章 主 要 讲述 了 正则 表达 式 的 相关 知识 ， 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 


(1) 线程 和 进程 是 怎么 定义 的 ? 
(2) 线程 如 何 使 用 ， 它 提供 了 哪些 模块 供 我 们 调用 ? 
(3) 线程 同步 和 优先 级 队列 如 何 实 现 ? 


思考 并 解决 如 下 问题 : 


(1) 进程 和 线程 的 区 别 。 

(2) 定义 一 个 类 或 函数 ， 实 现 一 个 线程 打印 信息 ， 另 一 个 线程 休眠 ， 线 程 打印 结束 后 进入 休 
眠 状态 ， 原 休眠 线程 唤醒 ， 执 行 打印 ， 打 印 结束 也 进入 休眠 ， 唤 醒 在 休眠 的 线程 ， 如 此 循环 交替 体 
眠 和 被 唤醒 。 

(3) 思考 有 哪些 方法 可 以 让 Python 代码 以 并 行 方式 运行 。 
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(4) 利用 本 章 所 学 的 内 容 并 查阅 相关 资料 ， 实 现 生 产 者 -消费 者 模型 。 

生产 者 -消费 者 模型 的 解释 如 下 : 

假设 有 一 个 公共 队列 ， 生 产 者 向 队列 中 写 数据 ， 消 费 者 从 队列 中 读数 据 。 当 队列 中 没有 任何 
数据 时 ， 消 费 者 应 该 停止 运行 并 等 待 (wait) ， 而 不 是 继续 尝试 读 取 数 据 ， 从 而 引发 读 取 空 队列 的 
异常 。 当 生产 者 在 队列 中 加 入 数据 后 ， 应 该 有 一 个 渠道 告诉 Cnotify) 消费 者 。 消 费 者 可 以 再 次 从 
队列 中 读 取 ， 而 IndexError 不 再 出 现 。 
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第 14 章 


发 送 和 接收 电子 邮件 


邮件 是 我 们 日 常 工作 中 主要 的 沟通 媒介 之 一 。 目 前 几乎 所 有 编程 语言 都 支持 发 送 和 接收 电子 
邮件 。 
本 章 将 介绍 如 何 使 用 Python 语言 发 送 和 接收 邮件 。 





14.1 电子 邮件 介绍 


Email〈 电 子 邮 件 ) 的 历史 比 Web 还 要 久远 。 直 到 现在 ，Email 还 是 互联 网 上 应 用 非常 广泛 的 
服务 。 

在 我 们 开始 编写 邮件 操作 的 相关 代码 之 前 ， 先 了 解 一 下 电子 邮件 在 互联 网 上 是 如 何 运作 的 。 

电子 邮件 其 实 是 我 们 现实 生活 中 快递 的 电子 化 ， 现 实 中 快递 是 怎么 处 理 的 呢 ? 比如 你 在 上 海 ， 
要 邮寄 一 份 信件 给 北京 的 朋友 。 

首先 需要 准备 好 邮寄 的 信件 ， 选 择 一 家 快递 公司 〈 一 般 是 上 门 取 件 或 到 代理 点 投递 ) ， 快 递 
公司 会 提供 对 应 的 信封 ， 在 信封 上 填写 地 址 ， 剩 下 的 事 就 由 快递 公司 处 理 了 。 

快递 公司 会 将 一 个 地 点 的 信件 从 就 近 的 小 代理 点 汇聚 到 一 个 快递 中 心 ， 再 从 快递 中 心 往 别 的 
城市 发 ， 比 如 先 发 到 河南 某 城市 的 快递 中 心 ， 再 从 该 处 发 往 北 京 ， 也 可 能 由 上 海 直达 北京 ， 不 过 你 
不 用 关心 具体 路 线 ， 只 需要 知道 一 件 事 ， 就 是 信件 走 得 比较 慢 ， 至 少 要 几 天 时 间 。 

信件 到 达 北 京 的 快递 中 心 后 ， 不 会 直接 送 到 朋友 的 手 里 。 快 递 员 为 了 避免 你 的 朋友 不 在 ， 而 
让 自己 白 跑 一 趟 ， 会 将 信件 投递 到 邮件 指定 的 地 址 ， 这 个 地 址 可 能 是 你 朋友 居住 地 附近 的 快递 箱 、 
家 里 或 所 在 公司 。 总 之 ， 当 你 的 朋友 知道 自己 的 信件 已 经 到 达 时 ， 就 可 以 取 到 信件 了 。 

电子 邮件 基本 上 是 按 上 面 的 方式 运作 的 ， 只 不 过 速度 不 是 按 天 算 ， 而 是 按 秒 算 。 

现在 回 到 电子 邮件 ， 假 设 自 己 的 电子 邮件 地 址 是 me@163.com， 对 方 的 电子 邮件 地 址 是 
friend@aliyun.com。 用 Outlook 或 Foxmail 之 类 的 软件 写 好 邮件 , 填 上 对 方 的 Email 地 址 , 单 击 “ 发 
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送 ” 按 钮 ， 电 子 邮件 就 发 送出 去 了 。 这 些 电子 邮件 软件 被 称 为 邮件 用 户 代理 (Mail User Agent， 
MUA) 。 

Email 从 MUA 发 出 去 后 ， 不 是 直接 到 达 对 方 计算 机 ， 而 是 发 到 邮件 传输 代理 (Mail Transfer 
Agent, MTA)， 就 是 Email 服务 提供 商 , 如 网 易 、 阿 里 云 等。 由 于 自己 的 电子 邮件 地 址 是 163.com， 
因此 Email 首先 被 投递 到 网 易 提供 的 MTA， 再 由 网 易 的 MTA 发 送 到 对 方 的 服务 商 ， 也 就 是 阿里 
的 MTA。 在 这 个 过 程 中 可 能 还 会 经 过 别 的 MTA, 但 是 我 们 不 用 关心 具体 路 线 , 只 需 关 心 速度 即 可 。 

Email 到 达 阿 里 的 MTA 后 ， 由 于 对 方 使 用 的 是 @aliyun.com 的 邮箱 ， 因 此 阿里 的 MTA 会 把 
Email 投递 到 邮件 的 最 终 目的 地 邮件 投递 代理 (Mail Delivery Agent, MDA) 。Email 到 达 MDA 后 ， 
会 存放 在 阿里 云 服务 器 的 某 个 文件 或 特殊 的 数据 库 里 , 我 们 将 这 个 长 期 保存 邮件 的 地 方 称 为 电子 邮 
箱 。 

同 普通 邮件 类 似 ，Email 不 会 直接 到 达 对 方 的 计算 机 ， 因 为 对 方 的 计算 机 不 一 定 开机 ， 开 机 也 
不 一 定 联网 。 对 方 要 取 到 邮件 ， 必 须 通 过 MUA 从 MDA 上 获得 。 

一 封 电子 邮件 的 旅程 是 : 

发 件 人 一 MUA 一 MTA 一 MTA 一 若干 个 MTA 一 MDA 一 MUA 一 收 件 人 

了 解 了 上 述 基 本 概念 后 ， 要 编写 程序 发 送 和 接收 邮件 ， 本 质 就 是 : 

(1) 编写 MUA 把 邮件 发 到 MTA。 
(2) 编写 MUA 从 MDA 上 收 邮 件 。 


发 邮件 时 ，MUA 和 MTA 使 用 的 协议 是 SMTP (Simple Mail Transfer Protocol， 简 单 邮件 传输 
协议 ) ， 后 面 的 MTA 到 另 一 个 MTA 也 是 用 SMTP 协议 。 

收 邮 件 时 , MUA 和 MDA 使 用 的 协议 有 两 种 : 一 种 是 POP (Post Office Protocol， 邮 局 协议 ) ， 
目前 版 本 是 3, 俗称 POP3; 另 一 种 是 IMAP (Internet Message Access Protocol，Internet 邮件 访问 协 
议 ) ， 目 前 版 本 是 4， 优 点 是 不 但 能 取 邮 件 ， 而 且 可 以 直接 操作 MDA 上 存储 的 邮件 ， 如 从 收 件 箱 
移 到 垃圾 箱 等 。 

邮件 客户 端 软 件 在 发 邮件 时 , 会 让 你 先 配 置 SMTP 服务 器 , 就 是 要 发 到 哪个 MTA 上 。 假设 你 
正在 使 用 163 邮箱 ， 就 不 能 直接 发 到 阿里 的 MTA 上 ， 因 为 它 只 服务 于 阿里 的 用 户 ， 所 以 需要 填写 
163 提供 的 SMTP 服务 器 地 址 smtp.163.com。 为 了 证 明 你 是 163 的 用 户 ，SMTP 服务 器 还 要 求 你 填 
写 邮 箱 地 址 和 客户 端 授权 密码 ， 这 样 MUA 才能 正常 把 Email 通过 SMTP 协议 发 送 到 MTA。 

同样 ， 从 MDA 收 邮件 时 ，MDA 服务 器 也 要 求 验 证 你 的 客户 端 授权 密码 ， 确 保 不 会 有 人 冒充 
你 收取 邮件 。 一 般 Outlook 之 类 的 邮件 客户 端 会 要 求 填写 POP3 或 IMAP 服务 器 地 址 、 邮 箱 地 址 和 
授权 密码 。 这 样 ，MUA 才能 顺利 通过 POP 或 IMAP 协议 从 MDA 取 到 邮件 。 

在 使 用 Python 收发 邮件 前 ， 需 要 先 准备 好 至 少 两 个 电子 邮件 ， 如 xxx@163.com 、 
Xxx@aliyun.com、xxx@qq.com 等 ， 注 意 两 个 邮箱 不 要 用 同一 家 邮件 服务 商 。 

最 后 特别 注意 ， 目 前 大 多 数 邮 件 服务 商都 需要 手动 打开 SMTP 发 信和 POP 收 信 功 能 ， 和 否则 只 
允许 在 网 页 登录 。 
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14.2 发 送 邮 件 


SMTP 是 发 送 邮件 的 协议 ，Python 内 置 对 SMTP 的 支持 ， 可 以 发 送 纯 文本 邮件 、HTML 邮件 
以 及 带 附件 的 邮件 。 本 节 以 网 易 163 的 服务 为 例 进行 介绍 。 学 习 本 节 内 容 时 , 可 以 自己 开通 对 应 的 
邮箱 服务 ,各 个 邮件 服务 公司 有 介绍 邮箱 服务 的 开通 方法 , 参照 开通 方法 开通 即 可 。 如 果 已 经 安装 
了 邮箱 服务 ， 就 可 以 使 用 自己 的 邮箱 服务 器 进行 学 习 。 


14.2.1 SMTP 发 送 邮 件 


Python 对 SMTP 的 支持 有 smtplib 和 email 两 个 模块 ，email 负责 构造 邮件 ，smtplib 负责 发 送 
邮件 。 

SMTP 是 从 源 地 址 到 目的 地 址 传送 邮件 的 规则 ， 由 该 协议 控制 信件 的 中 转 方式 。 

Python 的 smtplib 提供 了 一 种 很 方便 的 途径 发 送 电 子 邮件 ， 对 SMTP 协议 进行 了 简单 的 封装 。 

Python 创建 SMTP 对 象 的 语法 如 下 : 

smtpObj = smtplib.SMTP([host [, port [, local_hostname]]]) 

语法 中 各 个 参数 说 明 如 下 。 

@ ”host: SMTP 服务 器 主机 。 可 以 指定 主机 的 卫 地 址 或 域名 (如 wwwbaidu.com ), 是 可 选 参数 。 

@ “port: 如 果 提 供 了 host 参数 ， 就 需要 指定 SMTP 服务 使 用 的 端口 号 。 一 般 情 况 下 ，SMTP 的 

端口 号 为 25。 

@ local _ hostname: 如 果 SMTP 在 本 地 主机 上 ， 只 需要 指定 服务 器 地 址 为 localhost 即 可 。 

如 果 在 创建 SMTP 对 象 时 提供 了 host 和 port 两 个 参数 ， 在 初始 化 时 会 自动 调用 connect 方法 
连接 服务 器 。 

Python SMTP 对 象 使 用 sendmail 方法 发 送 邮 件 的 语法 如 下 : 

SMTP.sendmail(from addr, to_addrs, msg[, mail_options, rcpt_options] 

语法 中 各 个 参数 说 明 如 下 。 

@ from addr: 邮件 发 送 者 的 地 址 。 

@ to_ addrs: 字符 串 列表 ， 邮 件 发 送 地 址 。 

e msg: 发 送 消息 。 

msg 是 字符 串 ， 表 示 邮 件 内 容 。 我 们 知道 邮件 一 般 由 标题 、 发 信人 、 收 件 人 、 邮 件 内 容 、 附 
件 等 构成 ， 发 送 邮 件 时 ， 要 注意 msg 的 格式 。 这 个 格式 就 是 SMTP 协议 中 定义 的 格式 。 

SMTP 类 中 提供 了 表 14-1 所 示 的 一 些 常用 方法 。 
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表 14-1 SMTP 类 的 常用 方法 


方法 描述 





set_debuglevel(level) 设置 是 否 为 调试 模式 。 默 认为 False， 即 非 调 试 模式 ， 表 示 不 输出 任何 调试 信息 





connect([host[, port]) 连接 到 指定 的 SMTP 服务 器 。 参 数 分 别 表示 SMTP 服务 器 的 主机 和 端口 





docmd(cmd[, argstring]) | 向 SMTP 服务 器 发 送 指令 。 可 选 参数 argstring 表示 指令 的 参数 





helo([hostname]) 向 服务 器 确认 身份 。 相 当 于 告诉 SMTP 服务 器 “我 是 谁 ” 





has_extn(name) 


判断 指定 名 称 在 服务 器 邮件 列表 中 是 否 存在 。 出 于 安全 考虑 ，SMTP 服务 器 往往 屏 














蔽 该 指令 
判断 指定 邮件 地 址 是 否 在 服务 器 中 存在 。 出 于 安全 考虑 ，SMTP 服务 器 往往 屏蔽 该 
verify(address) 指令 
日 
登录 SMTP 服务 器 。 现在 几乎 所 有 SMTP 服务 器 都 必须 验证 用 户 信息 合法 后 才 允 许 
login(user password) 
发 送 邮 件 
quit() 断 开 与 SMTP 服务 器 的 连接 +， 相当 于 发 送 quit 指令 


普通 文本 邮件 发 送 的 实现 关键 要 将 MIMEText 中 的 _subtype 设置 为 plain。 首先 导入 smtplib 和 


MIMEText。 创 建 smtplib.smtp 实例 ， 连 接 邮件 SMTP 服务 器 ， 登 录 后 发 送 ， 具 体 代 码 如 下 
(send email.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*— 


import smtplib 
from email.mime.text import MIMEText 
from email.header import Header 


sender = 'from@163.com' 
pwd = 'xxxxx' # 开 通 邮箱 服务 后 ， 设 置 的 客户 端 授权 密 码 
receivers = ['toealiyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


# 三 个 参数 ， 第 一 个 为 文本 内 容 ， 第 二 个 plain 设置 文本 格式 ， 第 三 个 utf-8 设置 编码 
message = MIMEText ('Python 邮件 发 送 测试 .. ."， "Plain'， "utf-8") 
message['From'] = Header ("邮件 测试 "，'utf-8') 

message['To'] = Header ("测试 "，'utf-8') 


subject = 'Python SMTP 邮件 测试 ' 
message['Subject'] = Header (subject, ‘utf-8') 


try: 
# 使 用 非 本 地 服务 器 ， 需 要 建立 SSL 连接 
smtpObj = smtplib.SMTP SSL("smtp.163.com", 465) 
smtpObj .login (sender, pwd) 
smtpObj .sendmail (sender, receivers, message.as string()) 
Print ("邮件 发 送 成 功 ") 
except smtplib.SMTPException as se: 
Print (f"Error: 无 法 发 送 邮件 .case: {se}") 


我 们 使 用 3 个 引号 设置 邮件 信息 。 标 准 邮 件 需要 3 个 头 部 信息 : From、To 和 Subject。 每 个 信 


息 直 接 使 用 空 行 分 割 。 


我 们 通过 实例 化 smtplib 模块 的 SMTP_SSL 对 象 smtpObj 连接 SMTP 访问 ， 并 使 用 sendmail 
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方法 发 送信 息 。 
执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 
邮件 发 送 成 功 
如 果 本 地 主机 安装 了 sendmail 服务 ， 发 送 邮件 的 代码 可 以 更 改 为 : 
sender = "fromel163.com' 


receivers = ['toealiyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


# 三 个 参数 : 第 一 个 为 文本 内 容 ， 第 二 个 Plain 设置 文本 格式 ， 第 三 个 utf-8 设置 编码 
message = MIMEText ('Python 邮件 发 送 测试 .. ."， "Plain'， "utf-8") 
message['From'] = Header ("邮件 测试 "，'utf-8') 

message['To'] = Header ("测试 "，'utf-8') 


subject = 'Python SMTP 邮件 测试 ' 
message['Subject'] = Header (subject, ‘'utf-8') 


try: 
smtpObj = smtplib.SMTP ("localhost") 
smtpObj .sendmail (sender, receivers, message.as string()) 
print ("邮件 发 送 成 功 ") 
except smtplib.SMTPException as se: 
Print (f"Error: 无 法 发 送 邮 件 .Case: {se}") 


不 需要 客户 端 授权 密码 、SSL 连接 和 登录 服务 。 
根据 示例 蔡 换 相应 的 授权 密码 、SSL 连接 和 登录 服务 后 ， 本 地 执行 效果 如 图 14-1 所 示 。 


yuzhouliu 


this is a email test, don't reply. 





图 14-1 普通 邮件 发 送 效果 


14.2.2 ”发 送 HTML 格式 的 邮件 


如 果 我 们 要 发 送 的 是 HTML 邮件 ， 而 不 是 普通 的 纯 文 本 文件 怎么 办 呢 ? 方法 很 简单 ， 在 构造 
MIMEText 对 象 时 把 HTML 字符 串 传 进去 , 再 把 第 二 个 参数 由 plain 变 为 html 就 可 以 了 。 代码 实现 
如 下 (send_html email.py) : 

#! /usr/bin/python 


# -*-coding:UTF-8-*— 


import smtplib 
from email.mime.text import MIMEText 
from email.header import Header 
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sender = 'frome163.com'" 
pwad = 'xxxxx' # 开 通 邮 箱 服务 后 ， 设 置 的 客户 端 授权 密 码 
receivers = ['toealiyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


mail msg = """ 
<p>Python 邮件 发 送 测试 . . .</p> 

<p><a href="http://www.runoob.com"> 这 是 一 个 链接 </a></p> 
nnn 

message = MIMEText (mail msg, 'html', "utf-8') 
message['From'] = Header ("邮件 测试 "，'utf-8') 
message['To'] = Header ("测试 "，'utf-8') 


subject = 'Python SMTP 邮件 测试 ' 
message['Subject'] = Header (subject, ‘utf-8') 


try 
# 使 用 非 本 地 服务 器 ， 需 要 建立 SSL 连接 
smtpObj = smtplib.SMTP SSL("smtp.163.com", 465) 
smtpObj .login (sender, pwd) 
smtpObj .sendmail (sender, receivers, message.as string()) 
print ("邮件 发 送 成 功 ") 
except smtplib.SMTPException as se: 
Print (f"Error: 无 法 发 送 邮 件 .Case: {se}") 


执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 
邮件 发 送 成 功 
如 果 本 地 主机 安装 了 sendmail 服务 ， 就 不 需要 客户 端 授权 密码 、SSL 连接 和 登录 服务 ， 直 接 


使 用 smtplib 模块 的 SMTP 对 象 连接 本 地 访问 即 可 。 


14.2.3 ”发 送 带 附件 的 邮件 


身 ， 


如 果 Email 中 要 添加 附件 怎么 办 ? 
带 附件 的 邮件 可 以 看 作 包含 文本 和 各 个 附件 ， 可 以 构造 一 个 MIMEMultipart 对 象 代表 邮件 本 
然后 往 里 面 添加 一 个 MIMEText 作为 邮件 正文 ， 再 添加 表示 附件 的 MIMEBase 对 象 即 可 。 代 


码 实现 如 下 (send_fujian_email.py) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*— 


import smtplib 

from email .mime.text import MIMEText 

from email.mime.multipart import MIMEMultipart 
from email.header import Header 


sender = 'from@163.com' 
pwqd = "xxxxx" # 开 通 邮 箱 服务 后 ， 设 置 的 客户 端 授权 密码 
receivers = ['toealiyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


# 创 建 一 个 带 附件 的 实例 
message = MIMEMultipart() 
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message['From'] = Header ("邮件 测试 "，'utf-8') 
message['To'] = Header ("测试 "，'utf-8') 
subject = 'Python SMTP 邮件 测试 ' 
message['Subject'] = Header (subject, 'utf-8') 


# 邮 件 正 文 内 容 
message .attach (MIMEText(' 这 是 Python 邮件 发 送 测试 …… MYRPLIain ute-0u)) 


# 构造 附件 1， 传 送 当前 目录 下 的 test .txt 文件 

attl = MIMEText (open('test.txt', 'rb').read(), 'base64', 'utf-8') 
attl["Content-Type"] = 'application/octet-stream' 

# 这 里 的 filename 可 以 任意 写 ， 写 什么 名 字 ， 邮 件 中 就 显示 什么 名 字 
attl["Content-Disposition"] = 'attachment; filename="test.txt"' 
message.attach (att1) 


# 构造 附件 2， 传送 当前 目录 下 的 runoob.txt 文件 

att2 = MIMEText (open('runoob.txt', 'rb').read(), 'base64', ‘'utf-8') 
att2["Content-Type"] = 'application/octet-stream' 
att2["Content-Disposition"] = 'attachment; filename="runoob.txt"' 
message .attach (att2) 


Eye 
# 使 用 非 本 地 服务 器 ， 需 要 建立 SSL 连接 
SmtpObj = smtplib.SMTP SSL("smtp.163.com", 465) 
smtpObj .login(sender, pwd) 
smtpObj .sendmail (sender, receivers, message.as string()) 
print ("邮件 发 送 成 功 ") 
except smtplib.SMTPException as se: 
print (f"Error: 无 法 发 送 邮件 .case: {se}") 


执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 
邮件 发 送 成 功 


如 果 本 地 主机 安装 了 sendmail 服务 ， 就 不 需要 客户 端 授权 密码 、SSL 连接 和 登录 服务 ， 直 接 
使 用 smtplib 模块 的 SMTP 对 象 连接 本 地 访问 即 可 。 





14.2.4 “发送 图 片 


如 果 要 把 一 个 图 片 嵌入 邮件 正文 ， 怎 么 做 呢 ? 是 否 可 以 直接 在 HTML 邮件 中 链接 图 片 地 址 ? 

大 部 分 邮件 服务 商都 会 自动 屏蔽 带 有 外 链 的 图 片 ， 因 为 不 知道 这 些 链 接 是 否 指向 恶意 网 站 。 

要 把 图 片 嵌 入 邮件 正文 ， 我 们 只 需 按 照发 送 附件 的 方式 把 邮件 作为 附件 添加 进去 ， 然 后 在 
HTML 中 通过 引用 src="cid:0" 把 附件 作为 图 片 嵌 入 。 如 果 有 多 张 图 片 ， 就 需要 给 它们 依次 编号 ， 然 
后 引用 不 同 的 cid:x (send_picture_emailpy) 。 

#! /usr/bin/python 


# -*-coding:UTF-8-*— 


import smtplib 

from email.mime.image import MIMEImage 

from email.mime.multipart import MIMEMultipart 
from email.mime.text import MIMEText 
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from email.header import Header 


sender = 'from@163.com' 
pwq = 'xxxxx'， # 开 通 邮 箱 服务 后 ， 设 置 的 客户 端 授权 密码 
receivers = ['toealiyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


msgRoot = MIMEMultipart('related') 

msgRoot ['From'] = Header ("邮件 测试 "，'utf-8') 
msgRoot ['To'] = Header ("测试 "，'utf-8') 
subject = 'Python SMTP 邮件 测试 ' 

msgRoot ['Subject'] = Header (subject, "utf-8') 


msgAlternative = MIMEMultipart ('alternative') 
msgRoot .attach (msgAlternative) 


mail msg = """ 

<p>Python 邮件 发 送 测试 . . .</p> 

<p><a href="https://www.python.org">Python 官方 网 站 </a></p> 
<p> 图 片 演示 : </p> 

<p><img src="cid:imagel"></p> 


msgAlternative.attach (MIMEText (mail msg, 'html', "utf-8')) 


# 指定 图 片 为 当前 目录 

fp = open('test.png', 'rb') 
msgImage = MIMEImage (fp.read()) 
fp.close() 


# 定义 图 片 TD， 在 HTML 文本 中 引用 
msgImage.add header('Content-ID', '<imagel>') 
msgRoot .attach (msgImage) 


try: 
# 使 用 非 本 地 服务 器 ， 需 要 建立 SSL 连接 
smtpObj = smtplib.SMTP SSL("smtp.163.com", 465) 
smtpObj .login (sender, pwd) 
smtpObj .sendmail (sender, receivers, msgRoot.as_string()) 
Print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException as se: 
print (f"Error: 无 法 发 送 邮 件 .case: {se}") 


执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 

邮件 发 送 成 功 

如 果 本 地 主机 安装 了 sendmail 服务 ， 就 不 需要 客户 端 授权 密码 、SSL 连接 和 登录 服务 ， 直 接 
使 用 smtplib 模块 的 SMTP 对 象 连接 本 地 访问 即 可 。 





14.2.5 同时 支持 HTML 和 Plain 格式 


如 果 我 们 发 送 HTML 邮件 ， 收 件 人 通过 浏览 器 或 Outlook 之 类 的 软件 就 可 以 正常 浏览 邮件 内 
容 。 如 果 收 件 人 使 用 的 设备 太古 老 ， 查 看 不 了 HTML 邮件 怎么 办 呢 ? 
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from email.header import Header 


sender = 'from@163.com' 
pwq = 'xxxxx'， # 开 通 邮 箱 服务 后 ， 设 置 的 客户 端 授权 密码 
receivers = ['toealiyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


msgRoot = MIMEMultipart('related') 

msgRoot ['From'] = Header ("邮件 测试 "，'utf-8') 
msgRoot ['To'] = Header ("测试 "，'utf-8') 
subject = 'Python SMTP 邮件 测试 ' 

msgRoot ['Subject'] = Header (subject, "utf-8') 


msgAlternative = MIMEMultipart ('alternative') 
msgRoot .attach (msgAlternative) 


mail msg = """ 

<p>Python 邮件 发 送 测试 . . .</p> 

<p><a href="https://www.python.org">Python 官方 网 站 </a></p> 
<p> 图 片 演示 : </p> 

<p><img src="cid:imagel"></p> 


msgAlternative.attach (MIMEText (mail msg, 'html', "utf-8')) 


# 指定 图 片 为 当前 目录 

fp = open('test.png', 'rb') 
msgImage = MIMEImage (fp.read()) 
fp.close() 


# 定义 图 片 TD， 在 HTML 文本 中 引用 
msgImage.add header('Content-ID', '<imagel>') 
msgRoot .attach (msgImage) 


try: 
# 使 用 非 本 地 服务 器 ， 需 要 建立 SSL 连接 
smtpObj = smtplib.SMTP SSL("smtp.163.com", 465) 
smtpObj .login (sender, pwd) 
smtpObj .sendmail (sender, receivers, msgRoot.as_string()) 
Print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException as se: 
print (f"Error: 无 法 发 送 邮 件 .case: {se}") 


执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 

邮件 发 送 成 功 

如 果 本 地 主机 安装 了 sendmail 服务 ， 就 不 需要 客户 端 授权 密码 、SSL 连接 和 登录 服务 ， 直 接 
使 用 smtplib 模块 的 SMTP 对 象 连接 本 地 访问 即 可 。 





14.2.5 同时 支持 HTML 和 Plain 格式 


如 果 我 们 发 送 HTML 邮件 ， 收 件 人 通过 浏览 器 或 Outlook 之 类 的 软件 就 可 以 正常 浏览 邮件 内 
容 。 如 果 收 件 人 使 用 的 设备 太古 老 ， 查 看 不 了 HTML 邮件 怎么 办 呢 ? 


第 14 章 发 送 和 接收 电子 邮件 | 283 





办 法 是 在 发 送 HTML 的 同时 附加 一 个 纯 文本 ,如 果 收 件 人 无 法 查看 HTML 格式 的 邮件 ， 就 可 
以 自动 降级 查看 纯 文本 邮件 。 

利用 MIMEMultipart 可 以 组 合 一 个 HTML 和 Plain, 注意 指定 subtype 是 alternative。 使 用 代码 
格式 如 下 〈send two_style_emailpy) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


import smtplib 

from email.mime.image import MIMEImage 

from email.mime.multipart import MIMEMultipart 
from email.mime.text import MIMEText 

from email.header import Header 


sender = '15618942985@163.com' 
pwd = '1lyz111LYZz， # 开 通 邮箱 服务 后 ， 设 置 的 客户 端 授权 密码 
receivers = ['yuzhouliu@aliyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


msgRoot = MIMEMultipart('related') 

msgRoot ['From'] = Header ("邮件 测试 "，'utf-8') 
msgRoot ['To'] = Header ("测试 "，'utf-8') 
subject = 'Python SMTP 邮件 测试 ' 

msgRoot ['Subject'] = Header (subject, ‘'utf-8') 


msgAlternative = MIMEMultipart ('alternative') 
msgRoot .attach (msgAlternative) 


msgAlternative.attach (MIMEText ('hello', ‘plain', ‘'utf-8')) 
mail msg = '<html><body><hl>Hello</h1l></body></html>"' 
msgAlternative.attach (MIMEText (mail msg, "htm1'， ‘'utf-8')) 


# 指定 图 片 为 当前 目录 

fp = open('test.png', 'rb') 
msgImage = MIMEImage (fp.read()) 
fp.close() 


# 定义 图 片 ID， 在 HTML 文本 中 引用 
msgImage.add header('Content-ID', '<imagel>') 
msgRoot .attach (msgImage) 


try: 
# 使 用 非 本 地 服务 器 ， 需 要 建立 SSL 连接 
smtpObj = smtplib.SMTP SSL("smtp.163.com", 465) 
smtpObj .login(sender, pwd) 
smtpObj .sendmail (sender, receivers, msgRoot.as string()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException as se: 
print (f"Error: 无 法 发 送 邮 件 .Case:{sej") 


执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 
邮件 发 送 成 功 
查看 收 到 的 邮件 ， 如 图 14-2 所 示 。 
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14-2 “接收 带 附件 的 邮件 


14.2.6 加密 SMTP 


使 用 标准 25 端口 连接 SMTP 服务 器 时 使 用 的 是 明文 传输 , 发 送 邮件 的 整个 过 程 可 能 会 被 窃听 。 
要 更 安全 地 发 送 邮件 ， 可 以 加 密 SMTP 会 话 ， 实 际 上 是 先 创 建 SSL 安全 连接 ， 然 后 使 用 SMTP 协 
议 发 送 邮件 。 

某 些 邮件 服务 商 〈 如 Gmail) 提供 的 SMTP 服务 必须 进行 加 密 传输 。 下 面 来 看 如 何 通过 Gmail 
提供 的 安全 SMTP 发 送 邮 件 。 

由 于 Gmail 的 SMTP 端口 是 587， 因 此 修改 代码 如 下 : 


smtp_server = 'smtp.gmail .com' 

smtp_port = 587 

Server = smtplib.SMTP (smtp_ server, smtp port) 
server.starttls() 

# 剩 下 的 代码 和 前 面 的 一 模 一 样 


server.set_debuglevel (1) 


只 需要 在 创建 SMTP 对 象 后 立刻 调用 starttls() 方 法 , 就 可 以 创建 安全 连接 。 后 面 的 代码 和 前 面 
发 送 邮 件 的 代码 完全 一 样 。 

如 果 因 为 网 络 问 题 无 法 连接 Gmail 的 SMTP 服务 器 ， 请 相信 我 们 的 代码 是 没有 问题 的 ， 需 要 
对 网 络 设置 做 必要 的 调整 。 


14.3 ”POP3 接收 邮件 


SMTP 用 于 发 送 邮件 ， 如 果 要 收取 邮件 呢 ? 

收取 邮件 就 是 编写 一 个 MUA 作为 客户 端 ， 从 MDA 获取 邮件 到 用 户 的 计算 机 或 手机 上 。 收取 
邮件 最 常用 的 协议 是 POP， 目 前 版 本 是 3， 俗称 POP3。 

Python 内 置 了 一 个 poplib 模块 ， 用 于 实现 POP3 协议 ， 可 以 直接 用 来 收取 邮件 。 
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注意 POP3 协议 收取 的 不 是 可 以 阅读 的 邮件 ， 而 是 邮件 的 原始 文本 。 这 和 SMTP 协议 很 像 ， 
SMTP 发 送 的 也 是 经 过 编码 后 的 一 大 段 文本 。 

要 把 POP3 收取 的 文本 变 成 可 以 阅读 的 邮件 ,还 需要 用 email 模块 提供 的 各 种 类 解析 原始 文本 。 

收取 邮件 分 为 以 下 两 个 步骤 : 


(1) 用 poplib 把 邮件 的 原始 文本 下 载 到 本 地 。 
(2) 用 email 解析 原始 文本 ， 还 原 为 邮件 对 象 。 


14.3.1 POP3 下 载 邮 件 


POP3 协议 很 简单 。 下 面 获取 最 新 一 封 邮件 的 内 容 ， 代 码 如 下 〈pop_emailLpy) : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


import poplib 
from email.parser import Parser 


# 输入 邮件 地 址 、 口 令 和 POP3 服务 器 地 址 
email = input('Email: ') 

password = input('Password: ') 
Pop3_server = input('POP3 server: ') 


# 连接 到 POP3 服务 器 

Server = poplib.POP3(pop3 server) 

# 可 以 打开 或 关闭 调试 信息 

server.set debuglevel (1) 

# 可 选 ， 输 出 POP3 服务 器 的 欢迎 文字 

print (server.getwelcome() .decode('utf-8')) 


# 身份 认证 
server.user (email) 
Server.pass_ (password) 


# 1ist() 返 回 所 有 邮件 的 编号 
resp, mails, octets = server.list() 
# 可 以 查看 返回 的 列表 ， 类 似 [b'1 82923'，b'2 2184'，...] 


print (mails) 


# 获取 最 新 一 封 邮件 ， 注 意 索引 号 从 1 开始 
index = len(mails) 
resp, lines, octets = server.retr (index) 


# lines 存储 了 邮件 原始 文本 的 每 一 行 

# 可 以 获得 整个 邮件 的 原始 文本 

msg_content = b'\r\n'.join(lines) .decode('utf-8') 
# 稍 后 解析 邮件 


msg = Parser() .parsestr(msg content) 


# 可 以 根据 邮件 索引 号 直接 从 服务 器 删除 邮件 
# server.dele (index) 
# 关闭 连接 


server.quit () 
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用 POP3 获取 邮件 其 实 很 简单 ， 要 获取 所 有 邮件 ， 只 需要 循环 使 用 retr0 把 每 一 封 邮件 的 内 容 
拿 到 即 可 。 真 正 麻烦 的 是 把 邮件 的 原始 内 容 解析 为 可 以 阅读 的 邮件 对 象 。 


14.3.2 ”解析 邮件 


解析 邮件 的 过 程 和 构造 邮件 正好 相反 ， 需 要 先导 入 必要 的 模块 : 


from email.parser import Parser 
from email.header import decode header 
from email.utils import Parseaddr 


import poplib 
只 需要 一 行 代 码 就 可 以 把 邮件 内 容 解析 为 Message 对 象 : 
msg = Parser() .parsestr (msg_content) 


这 个 Message 对 象 可 能 是 一 个 MIMEMultipart 对 象 ， 即 包含 嵌 套 的 其 他 MIMEBase 对 象 ， 嵌 
套 可 能 还 不 止 一 层 。 
我 们 要 递归 地 输出 Message 对 象 的 层次 结构 : 


# indent 用 于 缩 进 显示 
def print info(msg, indent=0): 
if indent == 0: 
for header in ['From', 'To', 'Subject']: 
value = msg.get (header, '') 
if value: 
if header=="'Subject': 
value = decode str(value) 
else: 
hdr, addr = parseaddr (value) 
name = decode str (hdr) 
value = u'%s <%s>' % (name, addr) 
print('%s%s: %s' $$ (' ' * indent, header, value)) 
if (msg.is multipart()): 
parts = msg.get payload() 
for n, part in enumerate (Parts): 
print('%spart %s' % (' ' * indent, n)) 
Print( a et 
print info(part, indent + 1) 
else: 
content type = msg.get content type() 
if content type=='text/plain' or content type=='text/html': 
content = msg.get_ payload(decode=True) 
charset = guess_charset (msg) 
if charset: 
content = content .decode (charset) 


print('%sText: S38 $ (" " * indent; content + ',..')) 
else: 
print('%sAttachment: %s' % (' ' * indent, content type)) 


邮件 的 Subject 或 Email 中 包含 的 名 字 都 是 经 过 编码 的 str， 要 正常 显示 必须 进行 解码 ， 代 码 如 下 : 


def decode_str(s) : 


第 14 章 发 送 和 接收 电子 邮件 | 287 





value, charset = decode headger(s) [0] 
if charset: 

Value = value.decode (charset) 
return value 


decode_header() 返 回 一 个 list， 因 为 像 Cc、Bcc 这 样 的 字段 可 能 包含 多 个 邮件 地 址 ， 所 以 会 解 
析出 多 个 元 素 。 编 写 上 面 的 代码 时 偷懒 了 ， 只 取 了 第 一 个 元 素 。 
文本 邮件 的 内 容 也 是 str, 还 需要 检测 编码 , 否则 非 UTF-8 编码 的 邮件 都 无 法 正常 显示 , 代码 如 下 : 


def guess charset (msg) : 
charset = msg.get charset () 
if charset is None: 
content type = msg.get('Content-Type', '').lower() 
Pos = content type.find('charset=') 
if pos >= 0: 
charset = content type[pos + 8:] .strip() 
return charset 





14.4 “牛刀 小 试 一 一 邮件 发 送 通用 化 





将 本 章 介绍 的 邮件 发 送 的 示例 功能 抽象 化 ， 抽 象 为 一 个 函数 ， 该 函数 可 以 对 指定 人 员 发 送 邮 
件 ， 可 以 抄 送 给 对 应 人 ， 也 可 以 发 送 附件 ， 对 超过 一 定 大 小 的 附件 进行 压缩 ， 并 可 以 选择 是 否 删除 
附件 的 原件 。 

思维 点 拨 : 

(1) 函数 定义 ， 必 须 设置 参数 ; (2) 接收 、 抄 送 人 员 处 理 ; (3) 附件 处 理 ， (4) 附件 压 
缩 处 理 ，(5) 附件 原件 删除 处 理 。 

实现 示例 如 下 (email utils-py) : 


# -*- coding: utf 8 -*-— 
import datetime 

import os 

import smtplib 

import time 

import tarfile 

import zipfile 


from email.mime.base import MIMEBase 

from email.mime.multipart import MIMEMultipart 
from email.mime.text import MIMEText 

from email import encoders 

from email import utils 


to: 邮件 接收 者 
cc: 邮件 抄 送 者 
subject: 主题 
content: 正文 
attachments: 附件 


六 砷 砷 砷 砷 
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14.5 调 试 





对 于 电子 邮件 的 编码 ， 初 次 接触 的 开发 者 可 能 会 很 头疼 ， 特 别 是 很 少 使 用 邮件 的 开发 者 。 如 
果 你 在 学 习 过 程 中 产生 了 挫败 和 愤怒 感 ， 请 停 下 来 ， 出 去 散 散步 或 找 人 闲聊 一 会 儿 ， 当 你 平静 下 来 
后 再 思考 程序 。 

有 时 找到 一 个 问题 的 解决 办 法 确实 需要 时 间 ， 特 别 是 在 我 们 经 验 不 足 的 时 候 。 很 多 人 是 在 远 
离 计 算 机 ， 让 头脑 得 到 足够 的 休息 后 ,找到 了 更 加 可 行 的 方法 解决 某 些 问题 , 或 者 理 清 了 思路 ， 清 
楚 自 己 接 下 来 该 怎么 做 。 


14.6 ”问题 解答 


在 实际 应 用 开发 中 ， 邮 件 发 送 与 接收 使 用 得 多 吗 ? 

答 : 在 实际 应 用 开发 中 ， 邮 件 的 应 用 非常 广泛 。 计 算 机 应 用 中 ， 我 们 会 设置 很 多 自动 任务 或 
定时 任务 。 这 些 任务 执行 成 功 与 否 , 或 者 在 指定 时 间 是 否 执 行 , 我 们 一 般 都 是 通过 邮件 将 执行 结果 
发 送 给 相关 人 员 ， 以 便 实时 了 解 任务 的 执行 情况 。 一 旦 任务 执行 出 现 问题 ,我 们 可 以 快速 知晓 ， 可 
以 将 一 些 关键 错误 信息 放 在 邮件 中 ， 这 样 通过 查看 邮件 就 可 以 快速 排查 一 些 比较 常见 的 问题 。 


14.7 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲述 了 邮件 的 相关 知识 ， 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 


(1) SMPT 支持 发 送 哪些 类 型 的 邮件 ， 各 自 怎 么 实现 ? 
(2) POP3 如 何 接收 与 解析 邮件 ? 


思考 并 解决 如 下 问题 : 


(1) 向 自己 发 送 一 封 测试 邮件 ， 邮 件 主题 和 内 容 自 定 。 

(2) 向 某 个 邮件 服务 器 发 送 邮件 ， 查 看 是 否 被 拒绝 。 

(3) 向 某 个 邮箱 地 址 发 送 一 封 邮件 ， 并 抄 送 给 另 一 个 邮箱 地 址 。 

(4) 向 某 个 邮箱 地 址 发 送 邮件 ， 并 发 送 HTML 格式 的 文本 和 图 片 。 

(5) 发 送 带 附件 的 邮件 ， 尝 试 不 同 大 小 的 附件 (比如 : 100KB、1MB、10MB、50MB) 。 

从 一 个 网 页 上 用 正则 表达 式 匹配 出 一 批 邮 箱 地 址 ， 插 入 数组 ， 通 过 邮件 发 送 带 HTML、 图 片 、 
附件 的 群 邮件 到 这 些 邮 箱 。 
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网 络 编程 


Python 是 很 强大 的 网 络 编程 工具 。Python 有 很 多 针对 常见 网 络 协 议 的 库 ， 这 些 库 可 以 使 我 们 
集中 精力 在 程序 的 逻辑 处 理 上 ， 而 不 是 停留 在 网 络 实现 的 细节 中 。 使 用 Python 很 容易 写 出 处 理 各 
种 协议 格式 的 代码 ，Python 在 处 理 字 节 流 的 各 种 模式 方面 很 擅长 。 


15.1 初 识 网 络 编程 


自从 互联 网 诞生 以 来 ， 基 本 上 所 有 程序 都 是 网 络 程序 ， 很 少 有 单机 版 程序 了 。 

计算 机 网 络 把 各 个 计算 机 连接 到 一 起 ， 让 网 络 中 的 计算 机 可 以 互相 通信 。 网 络 编程 在 程序 中 
实现 了 两 台 计 算 机 的 通信 。 

举 个 例子 ， 当 你 使 用 浏览 器 访问 淘宝 网 时 ， 你 的 计算 机 和 淘宝 的 某 台 服务 器 通过 互联 网 连接 
起 来 了 ， 淘 宝 的 服务 器 就 会 把 网 页 内 容 作为 数据 通过 互联 网 传输 到 你 的 计算 机 上 。 

由 于 你 的 计算 机 上 可 能 不 止 有 浏览 器 ， 还 有 微 信 、 办 公 软 件 、 邮 件 客户 端 等 ， 不 同 程序 连接 
的 计算 机 也 会 不 同 , 因此 网 络 通信 是 两 台 计 算 机 的 两 个 进程 之 间 的 通信 。 比 如 , 浏览 器 进程 是 和 淘 
宝 服务 器 上 某 个 Web 服务 进程 通信 ， 而 微 信 进程 是 和 腾讯 服务 器 上 某 个 进程 通信 。 

网 络 编程 对 所 有 开发 语言 都 是 一 样 的 ,Python 也 不 例外 .用 Python 进行 网 络 编程 就 是 在 Python 
程序 的 进程 内 连接 别 的 服务 器 进程 的 通信 端口 进行 通信 。 


15.2 TCPI/IP 简介 


大 家 对 互联 网 应 该 很 熟悉 ， 计 算 机 网 络 的 出 现 比 互联 网 要 早 很 多 。 
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为 了 联网 ， 计 算 机 必须 规定 通信 协议 。 早 期 的 计算 机 网 络 都 是 由 各 厂商 自己 规定 一 套 协议 ， 
如 IBM 和 Microsof 都 有 各 自 的 网 络 协议 ， 互 不 兼容 。 这 就 好 比 一 群 人 有 的 说 英语 ， 有 的 说 中 文 ， 
有 的 说 德语 , 但 都 只 懂 一 种 语言 , 因此 只 有 说 同一 种 语言 的 人 可 以 交流 , 说 不 同 语言 的 人 就 不 行 了 。 

为 了 把 全 世界 所 有 不 同类 型 的 计算 机 都 连接 起 来 ， 必 须 规 定 一 套 全 球 通用 协议 。 为 了 实现 互 
联网 这 个 目标 , 大 家 共同 制定 了 互联 网 协议 簇 (Internet Protocol Suite) 作为 通用 协议 标准 。Internet 
是 由 inter 和 net 两 个 单词 组 合 起 来 的 ， 原 意 是 连接 “网 络 ” 的 网 络 ， 有 了 Internet， 只 要 支持 这 个 
协议 ， 任 何 私 有 网 络 都 可 以 连 入 互联 网 。 

互联 网 协议 包含 上 百 种 协议 标准 ， 由 于 最 重要 的 两 个 协议 是 TCP 和 了 协议 ,因此 大 家 把 互联 
网 协议 简称 为 TCP/IP 协议 。 

通信 时 双方 必须 知道 对 方 的 标识 ， 好 比 发 邮件 必须 知道 对 方 的 邮件 地 址 。 互 联网 上 计算 机 的 
唯一 标识 就 是 IP 地 址 ， 如 192.168.12.27。 如 果 一 台 计 算 机 同时 接 入 两 个 或 更 多 网 络 〈 如 路 由 器 ) ， 
就 会 有 两 个 或 多 个 IP 地 址 ， 所 以 IP 地 址 对 应 的 实际 是 计算 机 的 网 络 接口 ， 通 常 是 网 卡 。 

IP 协议 负责 把 数据 从 一 台 计 算 机 通过 网 络 发 送 到 另 一 台 计 算 机 。 数据 被 分 割 成 一 小 块 一 小 块 ， 
然后 通过 IP 包 发 送出 去 。 由 于 互联 网 链 路 复杂 ， 两 台 计 算 机 之 间 经 常 有 多 条 线路 ， 因 此 路 由 器 负 
责 决定 如 何 把 一 个 了 包 转 发 出 去 。IP 包 的 特点 是 按 块 发 送 ， 途 经 多 个 路 由 ， 但 不 保证 能 到 达 ， 也 
不 保证 按 顺 序 到 达 。IP 地 址 实际 上 是 一 个 32 位 整数 (IPv4) ， 以 字符 串 表 示 的 卫 地 址 实际 上 是 把 
32 位 整数 按 8 位 分 组 后 的 数字 表示 (如 192.168.0.1) ， 目 的 是 便于 阅读 。 

IPv6 地 址 实际 上 是 128 位 整数 ， 是 目前 使 用 的 IPv4 地 址 的 升级 版 ， 以 字符 串 表 示 类 似 于 
2001:0db8:85a3:0042:1000:8a2e:0370:7334。 

TCP 协议 建立 在 IP 协议 之 上 。TCP 协议 负责 在 两 台 计 算 机 之 间 建 立 可 靠 连 接 ， 保 证 数据 包 按 
顺序 到 达 。TCP 协议 会 通过 握手 建立 连接 ， 然 后 对 每 个 IP 包 编 号 ， 确 保 对 方 按 顺序 收 到 ， 如 果 包 


丢掉 了 就 自动 重 发 。 
许多 常用 的 更 高 级 的 协议 都 是 建立 在 TCP 协议 基础 上 的 ， 如 用 于 浏览 器 的 HTTP 协议 、 发 送 
邮件 的 SMTP 协议 等 。 


一 个 卫 包 除了 包含 要 传输 的 数据 外 ， 还 包含 源 人 P 地 址 和 目标 IP 地 址 、 源 端口 和 目标 端口 。 

端口 有 什么 作用 ? 两 台 计 算 机 通信 时 ， 只 发 P 地 址 是 不 够 的 ， 因 为 同一 台 计 算 机 运行 着 多 个 
网 络 程序 。 一 个 IP 包 来 了 之 后 交 给 浏览 器 还 是 微 信 ， 需 要 用 端口 号 进行 区 分 。 每 个 网 络 程序 都 向 
操作 系统 申请 唯一 的 端口 号 ， 这 样 两 个 进程 在 两 台 计算 机 之 间 建 立 网 络 连接 就 需要 各 自 的 IP 地 址 
和 端口 号 。 

一 个 进程 也 可 能 同时 与 多 台 计算 机 建立 连接 ， 因 此 它 会 申请 很 多 端口 。 


15.3 网络 设计 模块 


前 面 我 们 了 解 了 TCP/IP 协议 、IP 地 址 和 端口 的 基本 概念 ， 下 面 我 们 开始 了 解 网 络 编程 。 
标准 库 中 有 很 多 网 络 设计 模块 ， 除 了 明确 处 理 网 络 事务 的 模块 外 ， 还 有 很 多 模块 是 与 网 络 相 
关 的 。 接 下 来 我 们 讨论 其 中 几 个 模块 。 
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15.3.1 Socket 简介 


网 络 编程 中 有 一 个 基本 组 件 一 一 套 接 字 (Socket) 。 

套 接 字 为 特定 网 络 协议 (如 TCP/I[P、ICMP/IP、UDP/IP 等 ) 套件 对 上 的 网 络 应 用 程序 提供 者 
提供 当前 可 移植 标准 的 对 象 。 套 接 字 允许 程序 接收 数据 并 进行 连接 ， 如 发 送 和 接收 数据 。 为 了 建立 
通信 通道 ， 网 络 通信 的 每 个 端点 拥有 一 个 套 接 字 对 象 极为 重要 。 

套 接 字 为 BSD UNIX 系统 核心 的 一 部 分 , 而 且 被 许多 类 似 UNIX 的 操作 系统 (包括 Linux) 所 
采纳 。 许 多 非 BSD UNIX 系统 (如 MS-DOS、Windows、OS/2，Mac OS 及 大 部 分 主机 环境 ) 都 以 
库 形式 提供 对 套 接 字 的 支持 。 

3 种 最 流行 的 套 接 字 类 型 是 stream datagram 和 raw。stream 和 datagram 套 接 字 可 以 直接 与 TCP 
协议 进行 接口 ， 而 raw 套 接 字 与 IP 协议 进行 接口 。 套 接 字 并 不 限于 TCP/IP。 

套 接 字 主要 是 两 个 程序 之 间 的 “信息 通道 ”。 程 序 (通过 网 络 连接 ) 可 能 分 布 在 不 同 的 计算 
机 上 ， 通 过 套 接 字 相互 发 送信 息 。 在 Python 中 ， 大 多 数 网 络 都 隐藏 了 socket 模块 的 基本 细节 ， 并 
且 不 直接 和 套 接 字 交 互 。 





15.3.2 ”socket 模块 


套 接 字 模块 是 一 个 非常 简单 的 基于 对 象 的 接口 ， 提 供 对 低层 BSD 套 接 字样 式 网 络 的 访问 。 使 
用 该 模块 可 以 实现 客户 机 和 服务 器 套 接 字 。 要 在 Python 中 建立 具有 TCP 和 流 套 接 字 的 简单 服务 器 
需要 使 用 socket 模块 。 利 用 该 模块 包含 的 函数 和 类 定义 可 生成 通过 网 络 通信 的 程序 。 一 般 来 说 ， 
建立 服务 器 连接 需要 6 个 步骤 。 

GT01 创建 socket 对象。 

在 Python 中， 我 们 用 socket0 函 数 创建 套 接 字 ， 语 法 格式 如 下 : 

socket.socket([family[, type[, protocol]]]) 

efamily: 可 以 是 AF_UNIX (UNIX 域 , 用 于 同一 台 机 器 上 的 进程 间 通信 ) 也 可 以 是 AF_INET 

(对 于 IPv4 协议 的 TCP 和 UDP) 或 AF_INET6 (对 于 IPv6)。 
e type: 套 接 字 类 型 可 以 根据 面向 连接 和 非 连接 分 为 SOCK_STREAM ( 流 套 接 字 ) 或 
SOCK_ DGRAM ( 数据 报 文 套 接 字 )。 
”protocol: 一 般 不 填 ， 默 认为 0。 


family 参数 指定 调用 者 期 待 返回 的 套 接口 地 址 结构 的 类 型 。family 的 值 包括 3 种 : AF_INET、 
AF_INET6 和 AF_UNSPEC. 

如 果 指 定 AF_INET， 函 数 就 不 能 返回 任何 IPv6 相关 的 地 址 信息 。 

如 果 仅 指定 AF_INET6， 就 不 能 返回 任何 IPv4 地 址 信息 。 

AF_UNSPEC 意味 着 函数 返回 的 是 适用 于 指定 主机 名 和 服务 名 且 适 合 任 何 协议 簇 的 地 址 。 

如 果 某 个 主机 既 有 AAAA 记录 (IPv6) 地 址 ， 又 有 A 记录 (IPv4) 地 址 ， 那 么 AAAA 记录 将 
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作为 sockaddr in6 结构 返回 ， 而 A 记录 作为 sockaddr in 结构 返回 。 

AF_INET6 用 于 IPv6 系统 ，AF_INET 和 PF_INET 用 于 IPv4 系统 。 

AF 表示 ADDRESS FAMILY 地 址 簇 。 

PF 表示 PROTOCOL FAMILY 协议 簇 。 

在 Windows 系统 中 ，AF_INET 与 PF_INET 完全 一 样 ; 在 UNIX/Linux 系统 中 ， 不 同 版 本 的 
AF_INET 与 PF_INET 有 微小 差别 。 

702 将 socket 绑 定 ( 指派) 到 指定 地 址 上 ，socket.bind(address)。 


address 必须 是 一 个 双 元 素 元 组 ((host,port))， 参 数 为 主机 名 或 卫 地址 + 端口 号 。 如 果 端 口号 正 
在 被 使 用 或 保留 ， 主 机 名 或 PP 地 址 错误 ， 就 会 引发 socke.error 异常 。 


703 绑 定 后 必须 准备 好 套 接 字 ， 以 便 接 受 连接 请 求 。 

请 求 方式 如 下 : 

socket.listen (backlog) 

backlog 用 于 指定 最 多 连接 数 ， 至 少 为 1。 接 到 连接 请 求 后 ， 这 些 请 求 必须 排队 ， 如 果 队 列 已 
满 ， 就 拒绝 请 求 。 

C04 服务 器 套 接 字 通 过 socket 的 accept 方法 等 待 客户 请 求 一 个 连接 。 

请 求 方式 如 下 : 


connection,address=socket .accept () 


调用 accept 方法 时 ，socket 会 进入 等 待 (或 阻塞 ) 状态 。 客 户 请 求 连接 时 ，accept 方法 建立 连 
接 并 返回 服务 器 。accept 方 法 返回 一 个 含有 两 个 元 素 的 元 组 ， 如 (connection, address) 。 第 一 个 元 
素 (connection) 是 新 的 socket 对 象 ， 服 务 器 通过 它 与 客户 通信 ; 第 二 个 元 素 (address) 是 客户 的 
互联 网 地 址 。 

E3705 处 理 阶段 ， 服 务 器 和 客户 通过 send 和 recv 方法 通信 ( 传输 数据 )。 


服务 器 调用 send， 并 采用 字符 串 形式 向 客户 发 送信 息 。send 方法 返回 已 发 送 的 字符 个 数 。 服 
务 器 使 用 recv 方法 从 客户 接收 信息 。 调 用 recv 时 ， 必 须 指 定 一 个 整数 控制 本 次 调用 所 接收 的 最 大 
数据 量 。recv 方法 在 接收 数据 时 会 进入 blocket 状态 ， 最 后 返回 一 个 字符 串 ， 用 于 表示 收 到 的 数据 。 
如 果 发 送 的 量 超过 recv 允许 的 量 ， 数 据 就 会 被 截断 。 多 余 的 数据 将 缓冲 于 接收 端 。 以 后 调用 recv 
时 ， 多 余 的 数据 会 从 缓冲 区 删除 。 


C206 传输 结束 ， 服 务 器 调用 socket 的 close 方法 以 关闭 连接 。 
建立 一 个 简单 的 客户 连接 需要 4 个 步骤 。 

人 加 创建 一 个 socket 以 连接 服务 器 socket=socket.socket(family,type)。 
@ 使 用 socket 的 connect 方法 连接 服务 器 socket.connect((host,port))。 


@ 客户 和 服务 器 通过 send 和 recv 方法 通信 。 
@@ 结束 后 ， 客 户 通过 调用 socket 的 close 方法 关闭 连接 。 
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15.3.3 ”socket 对 象 ( 内 建 ) 方法 


socket 提供 了 表 15-1 所 示 的 服务 器 端 套 接 字 函数 。 


表 15-1 服务 器 端 套 接 字 函 数 














函数 描述 

bindO 绑 定 地 址 (hostport) 到 套 接 字 ,， 在 AF_INET 下 ， 以 元 组 〈hostport) 的 形式 表示 地 址 

listen() 开始 TCP 监听 。backlog 指定 在 拒绝 连接 之 前 ， 操 作 系 统 可 以 挂 起 的 最 大 连接 数量 。 该 值 至 少 
为 1， 大 部 分 应 用 程序 设 为 5 就 可 以 了 

accept() 被 动 接受 TCP 客户 端 连接 ， 等 待 连接 的 到 来 


socket 提供 了 表 15-2 所 示 的 客户 端 套 接 字 函数 。 


表 15-2 ”客户 端 套 接 字 函 数 











函数 描述 

connect() 主动 初始 化 TCP 服务 器 连接 。 一 般 address 的 格式 为 元 组 (hostname,port)。 如 果 连 接 出 错 ， 就 
返回 socket.error 错误 

connect ex0，| connect0 函 数 的 扩展 版 本 ， 出 错时 返回 出 错 码 而 不 是 抛 出 异常 


socket 提供 了 表 15-3 所 示 的 公共 用 途 套 接 字 函数 。 


表 15-3 公共 用 途 套 接 字 函 数 























函数 描述 

recvO) 接收 TCP 数据 ， 数 据 以 字符 串 形式 返回 ，bufsize 指定 要 接收 的 最 大 数据 
量 。flag 提供 有 关 消息 的 其 他 信息 ， 通 常 可 以 忽略 

send() 发 送 TCP 数据 ,将 string 中 的 数据 发 送 到 连接 的 套 接 字 。 返 回 值 是 要 发 送 
的 字 节 数量 ， 该 数量 可 能 小 于 string 的 字 节 大 小 

sendall0 完整 发 送 TCP 数据 。 将 string 中 的 数据 发 送 到 连接 的 套 接 字 ， 在 返回 之 前 
尝试 发 送 所 有 数据 。 成 功 返 回 None， 失 败 抛 出 异常 

recvform() 接收 UDP 数据 ， 与 recv0 类 似 ， 返 回 值 是 (data,address)。 其 中 ，data 是 
包含 接收 数据 的 字符 串 ，address 是 发 送 数据 的 套 接 字 地 址 

sendto() 发 送 UDP 数据 ， 将 数据 发 送 到 套 接 字 ，address 是 形式 为 〈ipaddrport) 的 
元 组 ， 指 定 远程 地 址 。 返 回 值 是 发 送 的 字 节 数 

close() 关闭 套 接 字 

getpeemame() 返回 连接 套 接 字 的 远程 地 址 。 返 回 值 通常 是 元 组 (ipaddr,port) 

getsockname() 返回 套 接 字 的 地 址 。 通 常 是 一 个 元 组 〈ipaddcport) 

setsockopt(level,optname,value) 设置 给 定 套 接 字 选项 的 值 

getsockopt(level,optname[.buflen]) | 返回 套 接 字 选项 的 值 





settimeout(timeout) 


设置 套 接 字 操作 的 超时 期 ，timeout 是 一 个 浮 点 数 ， 单 位 是 秒 。 值 为 None 
表示 没有 超时 期 。 一 般 超时 期 应 该 在 刚 创建 套 接 字 时 设置 ， 因 为 可 能 用 于 
连接 操作 (如 connectO) 





gettimeout() 





返回 当前 超时 期 的 值 ， 单 位 是 秒 ， 如 果 没有 设置 超时 期 ， 就 返回 None 
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( 续 表 ) 
函数 描述 
filenog0) 返回 套 接 字 的 文件 描述 符 
setblocking(flag) 如 果 flag 为 0， 就 将 套 接 字 设 为 非 阻塞 模式 ， 否 则 将 套 接 字 设 为 阻塞 模式 
(默认 值 )。 非 阻塞 模式 下 ， 如 果 调 用 recv0 没 有 发 现任 何 数据 ， 或 send0 
调用 无 法 立即 发 送 数据 ， 就 会 引起 socketerror 异常 
makefile0) 创建 一 个 与 该 套 接 字 相关 联 的 文件 


15.4 TCP 编程 


Socket 是 网 络 编程 的 一 个 抽象 概念 。 通 常 我 们 用 一 个 Socket 表示 “打开 了 一 个 网 络 连 接 ”， 而 打 
开 一 个 Socket 需要 知道 目标 计算 机 的 IP 地 址 和 端口 号 ， 并 且 指 定 协议 类 型 。 大 多 数 连接 都 是 可 靠 的 
TCP 连接 。 创 建 TCP 连接 时 ， 主 动 发 起 连接 的 是 客户 端 ， 被 动 响应 连接 的 是 服务 器 。 


15.4.1 客户 端 


当 我 们 在 浏览 器 中 访问 某 个 网 站 时 ， 自 己 的 计算 机 就 是 客户 端 ， 浏 览 器 会 主动 向 所 访问 网 站 
的 服务 器 发 起 连接 。 如 果 一 切 顺利 ， 所 访问 网 站 的 服务 器 接受 了 我 们 的 连接 ， 一 个 TCP 连接 就 建 
立 起 来 了 ， 接 着 就 可 以 发 送 网 页 内 容 了 。 

例如 , 要 创建 一 个 基于 TCP 连接 的 Socket( 以 连接 本 地 为 例 ), 可 以 这 样 做 (socket_create.py) : 

# 导入 socket 库 


import socket 


# 创建 一 个 socket 

s = socket.socket (socket .AF INET, socket.SOCK STREAM) 

# 获取 本 地 主机 名 

host = socket .gethostname() 

# 设置 端口 号 

Port = 9999 

# 连接 服务 ， 指 定 主机 和 端口 

s.connect((host，Port) ) 

创建 Socket 时 , AF_INET 指定 使 用 IPv4 协议 。 如果 要 用 更 先进 的 IPv6, 就 指定 为 AF_INET6。 
SOCK_STREAM 指定 使 用 面向 流 的 TCP 协议 ， 这 样 一 个 Socket 对 象 就 创建 成 功 了 ， 但 是 还 没有 
建立 连接 。 

如 果 客 户 端 要 主动 发 起 TCP 连接 ， 就 必须 知道 服务 器 的 人 P 地 址 和 端口 号 。 比 如 百度 的 卫 地 
址 可 以 用 域名 www.baidu.com 自动 转换 到 IP 地 址 ， 但 是 怎么 知道 百度 服务 器 的 端口 号 呢 ? 

作为 服务 器 ， 提 供 服务 时 端口 号 必须 固定 下 来 。 由 于 我 们 想 要 访问 网 页 ， 因 此 新 浪 提供 网 页 
服务 的 服务 器 必须 把 端口 固定 在 80 端口 。80 端口 是 Web 服务 的 标准 端口 。 其 他 服务 都 有 对 应 的 
标准 端口 号 ， 如 SMTP 服务 是 25 端口 ，FTP 服务 是 21 端口 ， 等 等 。 端 口号 小 于 1024 的 是 Internet 
标准 服务 端口 ， 端 口号 大 于 1024 的 可 以 任意 使 用 。 
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例如 ， 连 接 百 度 服务 器 的 代码 如 下 : 


s.connect(('www.baidu.com', 80)) 

建立 TCP 连接 后 ， 我 们 可 以 向 百度 服务 器 发 送 请求 ， 要 求 返回 首页 的 内 容 : 

# 发 送 数据 

s.send(b'GET / HTTP/1.1\r\nHost: www.baidu.com\r\nConnection: close\r\n\r\n') 

TCP 连接 创建 的 是 双向 通道 ， 双 方 可 以 同时 给 对 方 发 数据 。 谁 先 发 ， 谁 后 发 ， 怎 么 协调 ， 要 
根据 具体 协议 决定 。 例 如 ，HTTP 协议 规定 客户 端 必须 先 发 送 请 求 给 服务 器 ， 服务 器 收 到 后 才 发 送 

发 送 的 文本 格式 必须 符合 HTTP 标准 。 如 果 格 式 没 问题 ， 接 下 来 就 可 以 接收 百度 服务 器 返回 
的 数据 了 : 

# 接收 数据 

buffer = [] 


while True: 
# 每 次 最 多 接收 1 千 字 节 
d= s.recv(1024) 
if ds 
buffer .append (d) 
else: 
break 
data = b''.join(buffer) 


接收 数据 时 ， 调 用 recv(max) 方 法 一 次 最 多 接收 指定 的 字 节 数 ， 因 此 会 在 while 循环 中 反复 接 
收 ， 直 到 recv0) 返 回 空 数据 ， 表 示 接 收 完毕 ， 退 出 循环 。 

接收 完 数据 后 ， 调 用 close() 方 法 关闭 Socket， 一 次 完整 的 网 络 通信 就 结束 了 : 

# 关闭 连接 

s.close() 

接收 到 的 数据 包括 HTTP 头 和 网 页 ， 我 们 只 需要 把 HTTP 头 和 网 页 分 离 一 下 ， 输 出 HTTP 头 ， 
将 网 页 内 容 保存 到 文件 : 

header, html = data.split(b'\r\n\r\n', 1) 

print (header.decode ('utf-8')) 

# 把 接收 的 数据 写 入 文件 

with open('baidu.html', 'wb') as fi: 

上 .write (html) 
接 下 来 ， 只 需要 打开 baidu.html 文件 ， 就 可 以 进入 百度 首页 了 。 
下 面 是 以 上 功能 的 完整 代码 (socket baidu.py) 。 


#! /usr/bin/python3 
ding U0 = 








import socket 


def socket client(): 
# 创建 socket 对 象 
s = socket.socket (socket .AF INET, socket.SOCK STREAM) 
# 获取 主机 名 
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host = "www.baidu.com' 
# 设置 端口 号 
port = 80 


# 连接 服务 ， 指 定 主机 和 端口 


s.connect ( (host，Port) ) 


# 发 送 数据 
s.send(b'GET 
# 接收 数据 
buffer = [] 
while True: 


/ HTTP/1.1\r\nHost: www.baidu.com\r\nConnection: close\r\n\r\n') 


# 每 次 最 多 接收 1 千 字 节 
d= s.recv(1024) 


和 


buffer.append(d) 


else: 
break 


data = b''.join(buffer) 


header, html 
Print (header 


= data.split (b'\r\n\r\n', 1) 


decode ('utf-8')) 


# 把 接收 的 数据 写 入 文件 
with open('baidu.html', 'wb') as f: 
f.write (html) 


s.close() 


def main() : 


socket_client () 


人 


main() 


15.4.2 ”服务 器 编程 


和 客户 端 编程 相 比 ， 服 务 器 编程 更 复杂 一 些 。 
服务 器 编程 首先 要 绑 定 一 个 端口 ， 监 听 来 自 其 他 客户 端的 连接 。 如 果 某 个 客户 端 发 起 连接 了 ， 
服务 器 就 与 该 客户 端 建立 Socket 连接 ， 随 后 的 通信 就 靠 这 个 Socket 连接 了 。 


服务 器 会 打开 国 


定 端口 (如 80) 监听 ， 每 发 起 一 个 客户 端 连接 ， 就 创建 该 Socket 连接 。 由 于 


服务 器 有 大 量 来 自 客户 端的 连接 , 因此 要 能 够 区 分 一 个 Socket 连接 是 和 哪个 客户 端 绑 定 的 。 确 定 4 
项 唯一 的 Socket 依赖 : 服务 器 地 址 、 服 务 器 端口 、 客 户 端 地 址 、 客 户 端 端口 。 





服务 器 还 需要 同 


时 响应 多 个 客户 端 请求 ， 每 个 连接 都 需要 一 个 新 进程 或 新 线程 处 理 ， 否 则 服 


务 器 一 次 只 能 服务 一 个 客户 端 。 
下 面 编写 一 个 简单 的 服务 器 程序 ， 用 于 接收 客户 端 连接 ， 把 客户 端 发 过 来 的 字符 串 加 上 Hello 


再 发 回去 。 


首先 创建 一 个 基于 IPv4 和 TCP 协议 的 Socket， 操 作 如 下 : 


s = socket.socket(socket.AF_ INET， socket.SOCK STREAM) 


接 下 来 绑 定 监听 的 地 址 和 端口 。 服 务 器 可 能 有 多 块 网 卡 , 可 以 绑 定 到 某 一 块 网 卡 的 卫 地 址 上 ， 
也 可 以 用 0.0.0.0 绑 定 到 所 有 网 络 地 址 ， 还 可 以 用 127.0.0.1 绑 定 到 本 机 地 址 。127.0.0.1 是 一 个 特殊 


300 | Python 3.7 从 零 开始 学 





的 IP 地 址 ， 表 示 本 机 地 址 ， 如 果 绑 定 到 这 个 地 址 ， 客 户 端 必须 同时 在 本 机 运行 才能 连接 ， 外 部 计 
算 机 无 法 连接 进来 。 

端口 号 需要 预先 指定 。 因 为 我 们 写 的 服务 不 是 标准 服务 ， 所 以 用 9999 这 个 端口 号 。 注 意 ， 小 
于 1024 的 端口 号 必须 有 管理 员 权 限 才 能 绑 定 ， 操 作 如 下 : 

# 获取 本 地 主机 名 


host = socket .gethostname() 
# 设置 端口 号 

port = 9999 

# 监听 端口 

s.bind( (host, port)) 


接着 调用 listen0 方 法 开始 监听 端口 ， 传 入 的 参数 指定 等 待 连接 的 最 大 数量 : 


# 设置 最 大 连接 数 ， 超 过 后 排队 
s.listen(5) 


接 下 来 ， 服 务 器 程序 通过 一 个 永久 循环 接受 来 自 客户 端的 连接 ，accept() 会 等 待 并 返回 一 个 客 
户 端 连接 ， 操 作 如 下 : 


while True: 
# 接受 一 个 新 连接 
sock, addr = s.accept () 
# 创建 新 线程 处 理 TCP 连接 
t = threading.Thread(target=tcplink, args=(sock, addr)) 
七 .start () 


每 个 连接 都 必须 创建 新 线程 〈 或 进程 ) 来 处 理 ， 否 则 单线 程 在 处 理 连接 的 过 程 中 无 法 接受 其 
他 客户 端 连接 ， 操 作 如 下 : 
def tcp link(sock, addr): 
print('Accept new connection from %s:%s...' % addr) 
sock.send(' 欢 迎 学 习 Python 网 络 编程 !' .encode ('utf-8')) 
while True: 
data = sock.recv(1024) 
time.sleep (1) 
if not data or data.decode('utf-8') == "exit': 
break 
sock.send(('Hello, %s!' % data.decode('utf-8')) .encode('utfE-8')) 
sock.close() 
print ('Connection from %s:%s closed.' % addr) 


连接 建立 后 ， 服 务 器 首先 发 送 一 条 欢迎 消息 ， 然 后 等 待 客户 端 数据 ， 并 加 上 Hello 再 发 送 给 客 
户 端 。 如果 客户 端 发 送 了 exit 字符 串 ， 就 直接 关闭 连接 。 

要 使 用 这 个 服务 器 程序 ， 我 们 还 需要 一 个 客户 端 程序 ， 代 码 如 下 : 

Ss = socket.socket(socket.AF INET, socket.SOCK STREAM) 

# 获取 本 地 主机 名 

host = socket .gethostname () 

# 设置 端口 号 


port = 9999 
# 建立 连接 

















s.connect( (host, port)) 


# 接收 欢迎 消息 
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注意 ， 客 户 端 程序 运行 完毕 就 退出 了 ， 而 服务 器 程序 会 永远 运行 下 去 ， 必 须 按 Ctrl+C 快捷 键 
退出 程序 。 
下 面 是 以 上 功能 的 完整 代码 。 


服务 端 代码 实现 (socket_server.py): 
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if _ name ==' main ': 


def main(): 


socket_server() 


main () 


客户 端 代码 实现 (socket_client.py): 


#! /usr/bin/python3 
和 =*= coding:UTF=8 =*= 


import socket 


def socket client(): 


S = socket.socket (socket.AF INET, socket.SOCK STREAM) 
# 获取 本 地 主机 名 
host = socket.gethostname () 
port = 9999 
# 建立 连接 
s.connect ( (host, port)) 
# 接收 欢迎 消息 
print (s.recv(1024) .decode ('utf-8')) 
for data in ['" 小 萌 '，' 小 智 '， "小强 '] : 
# 发 送 数据 
s.send(data.encode ('utf-8')) 
print(s.recv(1024) .decode ('utf-8')) 
s.send(b'exit') 
s.close() 


def main() : 


socket_client() 


if _name = 一 "main ，: 


main() 


服务 器 和 客户 端 执 行 结果 如 图 15-1 和 15-2 所 示 。 





E:\python\pythoninstall\python. exe D:/python/workspace/socket_server_test. py 
Accept new correction from 192.168. 47.1:64215.. 


Connection from 192. 168. 47.1:64215 closed. 
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图 15-1 服务 器 输出 信息 





E:\python\pythoninstall\python. exe D:/python/workspace/socket_client_test. py 
欢迎 学 习 Python 了 网络 编 程 ! 

Hello， 小 萌 ! 

Hallo， 小 智 ! 

Hel1o， 小 强 ! 








15-2 ”客户 端 输出 信息 


第 15 章 网 络 编程 | 303 





15.5 ”UDP 编程 





TCP 用 于 建立 可 靠 连接 ， 并 且 通 信 双 方 可 以 以 流 的 形式 发 送 数据 。 相 对 于 TCP，UDP 面向 无 
连接 的 协议 。 

使 用 UDP 协议 时 不 需要 建立 连接 ,只 需要 知道 对 方 的 耳 地 址 和 端口 号 就 可 以 直接 发 送 数据 包 。 
但 是 发 送 的 数据 包 是 否 能 到 达 就 不 知道 了 。 

虽然 用 UDP 传输 数据 不 可 靠 ， 但 是 优点 是 速度 快 。 对 于 不 要 求 可 靠 到 达 的 数据 可 以 使 用 UDP 
协议 。 

下 面 来 看 如 何 通过 UDP 协议 传输 数据 。 和 TCP 类 似 ， 使 用 UDP 的 通信 双方 也 分 为 客户 端 和 
服务 器 。 服 务 器 首先 需要 绑 定 端口 ， 操 作 如 下 : 

Ss = socket.socket (socket.AF_INET, socket.SOCK DGRAM) 

host = socket .gethostname () 

Port = 9999 


# 绑 定 端口 
s.bind( (host, port)) 


创建 Socket 时 ，SOCK_DGRAM 指定 了 Socket 的 类 型 是 UDP。 绑 定 端口 和 TCP 一 样 ， 不 过 
不 需要 调用 listen0 方 法 ， 而 是 直接 接收 来 自任 何 客 户 端的 数据 ， 操 作 如 下 : 
while True: 
# 接收 数据 
data, addr = s.recvfrom(1024) 
print ('Received from %s:%s.' $% addr) 
s.sendto(b'Hello, %s!' % data, addr) 


recvfrom() 方 法 返回 数据 和 客户 端的 地 址 与 端口 。 这 样 , 服务 器 收 到 数据 后 ， 直 接 调 用 sendto() 
就 可 以 把 数据 用 UDP 发 送 给 客户 端 。 
客户 端 使 用 UDP 时 ， 首 先 仍然 是 创建 基于 UDP 的 Socket， 然 后 不 需要 调用 connect)， 直 接 
通过 sendto0) 给 服务 器 发 送 数据 ， 操 作 如 下 : 
S = socket.socket (socket.AF INET, socket.SOCK DGRAM) 
for data in [b'Michael', b'Tracy', b'Sarah']: 
# 发 送 数据 
s.sendto(data, ('127.0.0.1', 9999)) 
# 接收 数据 
print (s.recv (1024) .decode ('utf-8°')) 
s.close() 


下 面 是 以 上 功能 的 完整 代码 。 
服务 器 端 (socket_udp_server.pyt): 


#! /usr/bin/python3 
# -*- coding:UTF-8 —*— 


import socket 
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客户 端 (socket_udp_client.py): 





服务 器 和 客户 端 执行 结果 如 图 15-3 和 15-4 所 示 。 
E:\python\pythoninstall\python exe D:/python/workspace/udp_test. py 
Received from 192.168. 47.1:65102. 
Received from 192. 168. 47.1:65102. 


图 15-3 服务 器 输出 信息 
E:\python\pythoninstall\python exe D:/python/workspace/socket_client_test. py 





hello， 小 萌 , welcomel 
hello， 小 智 , welcome! 





图 154 客户 端 输出 信息 
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15.6 “urllib 模块 


在 Python 能 使 用 的 各 种 网 络 工作 库 中 ， 功 能 最 强大 的 是 urllib。urllib 能 够 通过 网 络 访问 文件 ， 
就 像 这 些 文件 在 我 们 的 计算 机 上 一 样 。 通 过 一 个 简单 的 函数 调用 ， 几 乎 可 以 把 任何 URL 指向 的 事 
物 用 作 程序 输入 。 

urllib 提供 了 一 系列 用 于 操作 URL 的 功能 ， 其 中 常用 的 请 求 是 GET 和 POST。 下 面 简单 介绍 
一 下 在 Python 中 使 用 GET 和 POST 请 求 。 


15.6.1 GET 请 求 


urllib 的 request 模块 可 以 非常 方便 地 抓 取 URL 内 容 ， 也 就 是 发 送 一 个 GET 请 求 到 指定 页 面 ， 
然后 返回 HTTP 响应 ， 示 例如 下 (get_request.py) : 


#! /usr/bin/python3 
# -*- coding:UTF-8 一 * 一 


from urllib import request 


def get_ request(): 
with request.urlopen('http://www.baidu.com') as f: 
data = f.read() 
print(f'Status:{f.status} {f.reason}') 
for k, v in f.getheaders(): 
print(f'{k}: {v}') 
Print (f"Data: {data.decode ('utf-8')}") 


def main(): 
get request() 


if name ==" main _": 
main() 


运行 程序 ， 得 到 HTTP 响应 的 头 和 JSON 数据 ， 代 码 如 下 : 


Status: 200 OK 

Content-Type: text/html 

Content-Length: 6234 

Data: <!DOCTYPE html><html><head><meta 
http-equiv="content-type"content="text/html;charset=utf-8"/><meta 
http-equiv="X-UA-Compatible"content="IE=Edge"/><meta content="never"name="referrer"/><title> 百 


度 一 下 ， 你 就 知道 


如 果 想 模拟 浏览 器 发 送 GET 请 求 ， 就 需要 使 用 Request 对 象 ， 通 过 往 Request 对 象 添加 HTTP 
头 可 以 把 请 求 伪装 成 浏览 
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15.6.2 POST 请 求 


如 果 要 以 POST 发 送 一 个 请 求 ， 就 要 把 参数 data 以 bytes 形式 传 入 。 
模拟 一 个 微 博 登 录 ， 先 读 取 登录 的 邮箱 和 口令 ， 然 后 按照 weibo.cn 登录 页 的 格式 以 
username=Xxx&password=xxx 的 编码 传 入 ， 代 码 实现 如 下 〈login_postpy) : 





执行 该 程序 ， 并 输入 对 应 的 username 和 password， 若 账户 存在 ， 则 得 到 如 下 结果 : 
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Status: 200 OK 
Server: nginx/1.2.0 
Date: Sat，22 Oct 2016 08:38:37 GMT 


Data: {"retcode":20000000,"msg":"","data":{...,"uid":"3538172252"}} 


若 登 录 失败 ， 则 得 到 如 下 输出 结果 : 


Status: 200 OK 
Server: nginx/1.2.0 
Date: Sat, 22 Oct 2016 08:46:04 GMT 


{"retcode":50011015,"msg":"\u7528\u6237\u540d\u6216\u5bc6\u7801\u9519\u8bef", "data": {"username 
":"test@aliyun.com","errline":634}} 


urllib 提供 的 功能 是 利用 程序 执行 各 种 HTTP 请 求 。 如 果 要 模拟 浏览 器 完成 特定 功能 ， 就 要 把 
请 求 伪装 成 浏览 器 。 伪 装 的 方法 是 先 监控 浏览 器 发 出 的 请 求 ， 再 根据 浏览 器 的 请 求 头 进行 伪装 ， 
User-Agent 头 就 是 用 来 标识 浏览 器 的 。 


15.7 ”牛刀 小 试 一 一 模拟 浏览 器 


写 一 个 简单 的 企 虫 ， 模 拟 浏览 器 操作 ， 输 入 网 址 ， 抓 取 网 页 内 容 。 
思维 点 拨 : 

(1) 浏览 器 模拟 请 求 头 的 编写 ， (2) URL 读 取 ; 。 (3) HTML 文本 解码 。 
简单 实现 示例 如 下 (browser_simulation.py) : 


# ~-*- coding: utf 8 -*-— 
import Urllib.request 


# 伪装 成 浏览 器 (此 处 伪装 成 chrome) 
HEADERS = ('User-Agent', 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 ' 
' (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36') 


# 取得 网 页 内 容 
def get content(url path): 
opener = urllib.request.build opener() 
# 将 伪装 成 的 浏览 器 添加 到 对 应 的 http 头 部 
opener.addheaders=[HEADERS] 
# 读 取 相应 的 url 
read_ contend = opener.open(url path) .read() 
# 将 获得 的 html 解码 为 utf-8 
data = read contend.decode('utf-8') 
Print (data) 
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if name ==" main ": 
get_ content('http://news.baidu.com/') 


执行 代码 ， 可 以 看 到 打印 出 整个 网 站 页 面 的 HTML 格式 的 文本 内 容 。 此 处 省 略 打 印 结果 的 展示 。 
15.8 调 试 


当 我 们 使 用 更 高 级 的 程序 时 ， 普 通 输出 和 手动 检查 程序 的 方式 已 经 不 那么 好 用 了 。 下 面 是 一 
些 高 级 程序 调试 的 建议 : 

(1) 检查 概要 信息 和 类 型 。 运 行 时 错误 的 一 个 常见 原因 是 某 个 值 的 类 型 不 对 。 调 试 这 种 错误 
时 ， 通 常 只 需要 输出 值 的 类 型 就 足够 了 。 

(2) 编写 自 检查 逻辑 。 有 时 可 以 写 代码 自动 检查 错误 。 比 如 登录 时 ， 如 果 第 一 次 登录 失败 ， 
就 可 以 隔 一 定时 间 间 隔 再 次 登录 ,超出 一 定 登 录 次 数 就 不 再 尝试 。 或 者 在 访问 某 个 网 站 时 ， 根 据 返 
回 的 响应 结果 中 的 某 个 或 某 些 值 选 择 做 对 应 的 工作 。 

(3) 美化 输出 。 格 式 化 输出 可 以 更 容易 发 现 错误 ， 如 将 内 置 类 型 的 值 以 更 加 入 性 化 的 可 读 格 
式 输 出 。 另 一 方面 ， 花 费时 间 构 建 脚手架 代码 可 以 减少 未 来 调试 的 时 间 。 





15.9 ”问题 解答 


Python 网 络 编程 需要 学 习 哪些 网 络 相 关 知 识 ? 

答 : Python 网 络 编程 是 一 个 很 大 的 范畴 ， 可 以 从 以 下 几 点 进行 相关 学 习 

(1) 学 习 如 何 使 用 Python 创建 Socket， 如 何 将 Socket 与 指定 的 了 P 地 址 和 端口 进行 绑 定 ， 使 
用 Socket 发 送 数据 、 接 收 数据 。 

(2) 学 习 如 何 使 用 Python 处 理 线程 ， 从 而 编写 可 以 同时 处 理 多 个 请 求 的 Web 服务 器 。 

(3) 学 习 如 何 使 用 Python 控制 HTTP 层 的 逻辑 , 如 何 创建 HTTP GET、POST、 PUT、 DELETE 
请 求 ， 如 何 处 理 接收 到 的 HTTP 请 求 ， 这 些 分 别 涉及 Python 的 httplib、basehttpserver 等 模块 。 

了 解 以 上 几 点 后 ， 接 下 来 掌握 一 种 Python 基本 的 Web 开发 框架 ， 如 web.py、Django、Pylon 
等 。 在 学 习 框架 的 基础 上 再 去 了 解 非 阻 塞 式 的 HTTP Server (如 Tornado) 和 Twisted (Python 编写 
消息 驱动 的 网 络 引擎 ) 。 


15.10” 温 故 知 新 ， 学 以 致 用 


本 章 介 绍 了 Python 用 于 网 络 编程 的 一 些 方法 。 究 竞选 择 什 么 方法 取决 于 程序 特定 的 需要 和 开 
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发 者 的 偏好 。 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 


(1) 什么 是 TCP/IP? 
(2) 有 哪些 网 络 设计 模块 ? 

(3) TCP 编程 和 UDP 编程 分 别 是 怎样 实现 的 ? 
思考 并 解决 如 下 问题 : 

(1) 面向 连接 的 套 接 字 和 无 连接 套 接 字 之 间 的 区 别 。 

(2) TCP 和 UDP 中， 哪 种 类 型 的 服务 器 接受 连接 ， 并 将 它们 转换 到 独立 的 套 接 字 进行 客户 

端 通信 。 

(3) 写 程序 登录 某 个 网 站 。 

(4) 将 登录 返回 结果 写 入 一 个 HTML 文件 ， 使 得 可 以 直接 单 击 该 文件 进入 网 站 。 

(5) 对 返回 结果 进行 分 析 ， 提 取 一 些 有 用 信息 ， 如 提取 汉字 或 网 页 上 的 链接 地 址 。 








代码 实例 
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GUI 编程 


本 章 将 对 图 形 用 户 界 面 (Graphical User Interface，GUI) 编程 进行 简要 的 介绍 ， 也 就 是 那些 带 
有 按钮 和 文本 框 的 窗口 等 。 

目前 支持 Pyhton 的 GUI 工具 包 有 很 多 ， 但 是 没有 一 个 被 认为 是 标准 的 。 本 章 通过 对 Python 
默认 的 GUI 工具 包 一 一 tkinter 的 讲解 ， 让 大 家 熟悉 Python 的 GUI。 


16.1 _ GUI 简介 


在 开始 GUI 编程 之 前 ， 先 对 几 个 GUI 库 做 一 个 大 体 了 解 ， 然 后 学 习 安 装 tkinter。 


16.1.1 常用 GUI 库 简 介 





Python 提供 了 多 个 图 形 开发 界面 的 库 ， 几 个 常用 的 Python GUI 库 如 下 。 

tkinter: tkinter 模块 〈Tk 接口 ) 是 Python 的 标准 Tk GUI 工具 包 的 接口 。Tk 和 tkinter 可 以 在 
大 多 数 的 UNIX 平台 下 使 用 ， 同 样 可 以 应 用 在 Windows 和 Macintosh 系统 中 。Tk8.0 的 后 续 版 本 可 
以 实现 本 地 窗口 风格 ， 并 良好 地 运行 在 绝 大 多 数 平 台中 。 

wxPython: wxPython 是 一 款 开 源 软件 ,是 Python 语言 的 一 套 优秀 的 GUI 图 形 库 ， 允 许 Python 
程序 员 很 方便 地 创建 完整 的 、 功 能 键 全 的 GUI 用 户 界面 。 

Jython: Jython 程序 可 以 和 Java 无 颖 集成 。 除 了 一 些 标准 模块 外 ，Jython 使 用 Java 的 模块 。 
Jython 几乎 拥有 标准 的 Python 中 不 依赖 于 C 语言 的 全 部 模块 ， 比 如 ，Jython 的 用 户 界面 将 使 用 
Swing、AWT 或 者 SWT。Jython 可 以 被 动态 或 静态 地 编译 成 Java 字 节 码 。 
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16.1.2 ”安装 tkinter 


tkinter 是 Python 的 标准 GUI 库 。Python 使 用 tkinter 可 以 快速 地 创建 GUI 应 用 程序 。 
由 于 tkinter 是 内 置 到 Python 的 安装 包 中 的 ， 安 装 好 Python 之 后 ， 可 通过 import tkinter 导入 ， 
即 在 对 应 的 .py 文件 中 执行 如 下 语句 即 可 : 


import 七 kinter 





16.2 ”概念 介绍 


在 开始 GUI 编程 之 前 ， 需 要 先 了 解 这 几 个 概念 : 窗口 和 控件 、 事 件 驱 动 处 理 、 布 局 管理 器 。 
开始 之 前 ， 我 们 先 看 一 个 小 示例 〈label_exp.py) : 


from tkinter import * 


top = Tk() 

label = Label (top, text = 'hello world') 
label .pack () 

top.mainloop() 


执 


16.2. 


在 

















行 示 例 ， 可 以 得 到 如 图 16-1 所 示 的 结果 。 
1 窗口 和 控件 hello world 
GUI 编程 中 , 顶层 的 根 窗 口 对 象 包含 组 成 GUI 应 用 的 所 有 小 图 16-1 示例 结果 


窗口 对 象 ， 它 们 可 以 是 文字 标签 、 按 钮 、 列 表 框 等 ， 这 些 独立 的 GUI 组 件 称 为 控件 。 当 创建 一 个 


顶层 窗 


口 时 ， 指 的 是 需要 一 个 地 方 来 摆 放 所 有 的 控件 。 在 Python 中 ,一般 用 如 下 语句 创建 根 窗口 : 


import tkinter 
top = tkinter.Tk() 


或 如 label_exp.py 代码 中 的 : 


from tkinter import * 
top = Tk() 


tkinter.Tk() 返 回 的 对 象 通常 称 为 根 窗口 。 
顶层 窗口 是 那些 在 应 用 中 独立 显示 的 部 分 ，GUI 程序 中 可 以 有 多 个 顶层 窗口 ， 但 只 能 有 一 个 


根 窗口 








。 在 实际 应 用 中 ， 可 以 先 把 控件 全 部 设计 好 ， 再 添加 功能 ， 也 可 以 边 设计 控件 边 添加 功能 。 


控件 可 以 独立 存在 ， 也 可 以 作为 容器 存在 。 如 果 一 个 控件 包含 其 他 控件 ， 就 可 以 称 其 为 其 他 
控件 的 父 控件 。 若 一 个 控件 被 其 他 控件 包含 ， 则 称 其 为 那个 控件 的 子 控件 ， 而 父 控件 就 称 为 包围 它 
的 容器 控件 。 

控件 有 一 些 相关 的 行为 ， 如 按 下 按钮 、 将 文本 写 入 文本 框 等 ， 这 些 行为 称 为 事件 ， 而 GUI 对 
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这 类 事件 的 响应 称 为 回调 。 





16.2.2 ”事件 驱动 处 理 


事件 包括 按 下 按钮 及 释放 、 鼠 标 移动 、 按 回 车 键 等 。 一 个 GUI 应 用 从 开始 到 结束 就 是 通过 整 
套 事件 体系 来 驱动 的 ， 这 种 方式 称 为 事件 驱动 处 理 。 

最 简单 的 鼠标 移动 就 是 一 个 带 有 回调 事件 的 例子 。 若 鼠标 指针 正 停 在 GUI 应 用 项 层 窗口 的 某 
处 , 你 将 鼠标 移动 到 应 用 的 另 一 部 分 ， 鼠标 移动 的 行为 会 被 复制 到 屏幕 的 光标 上 ,于 是 看 起 来 像 是 
根据 你 的 手 移动 的 。 系 统 通过 处 理 这 些 移动 事件 便 绘制 出 了 窗口 上 的 指针 移动 。 当 释放 鼠标 后 ， 不 
再 有 事件 需要 处 理 ， 此 时 屏幕 会 重新 恢复 闲置 的 状态 。 





16.2.3 ”布局 管理 器 


Tk 有 3 种 布局 管理 器 : Placer、Packer、Grid。 

Placer 是 最 原始 的 布局 管理 器 ，Placer 的 做 法 非常 直接 ， 只 需 提 供 控件 的 大 小 和 摆 放 位 置 ， 然 
后 管理 器 就 会 自动 将 其 摆 放 好 。 但 这 有 一 个 问题 ， 就 是 你 必须 对 所 有 控件 进行 这 些 操作 ， 这 会 加 重 
编程 开发 者 的 负担 ， 因 为 这 些 操作 本 应 该 是 自动 完成 的 。 

Packer 是 较为 常用 的 布局 管理 器 。Packer 会 把 控件 填充 到 正确 的 位 置 ， 然 后 对 于 之 后 的 每 个 
控件 ， 会 去 寻找 剩余 空间 进行 填充 。 这 和 出 去 旅行 时 往 行李 箱 中 塞 行李 的 过 程 一 样 ， 尽 管 往 里 塞 ， 
会 自动 填充 。 

一 旦 Packer 确定 好 所 有 控件 的 大 小 和 对 齐 方式 ， 就 会 在 屏幕 上 将 控件 放置 妥当 。 

Grid 可 用 于 网 络 坐 标 ， 使 用 Grid 来 指定 GUI 控件 的 位 置 。 





16.3 Tk 控件 


tkinter 提供 各 种 控件 ， 如 按钮 、 标 签 和 文本 框 等 ， 在 一 个 GUI 应 用 程序 中 使 用 。 这 些 控件 有 
时 也 被 称 为 部 件 。 
目前 有 19 种 tkinter 的 控件 。 表 16-1 对 各 个 控件 做 了 简单 的 介绍 。 


表 16-1 tkinter 控件 

















控件 描述 
Button | 按钮 控件 ， 在 程序 中 显示 按钮 

Canvas 画布 控件 ， 显 示 图 形 元 素 ， 如 线条 或 文本 

Checkbutton 多 选 框 控件 ， 用 于 在 程序 中 提供 多 项 选择 框 

Entry 输入 控件 ， 用 于 显示 简单 的 文本 内 容 

Frame 框架 控件 ， 在 屏幕 上 显示 一 个 矩形 区 域 ， 多 用 来 作为 容器 
Label | 标签 控件 ， 可 以 显示 文本 和 位 图 





Listbox 列表 框 控件 ，Listbox 窗口 小 部 件 用 来 显示 一 个 字符 串 列表 给 用 户 
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( 续 表 ) 
控件 描述 
Menubutton 菜单 按钮 控件 ， 用 于 显示 菜单 项 
Menu 菜单 控件 ， 显 示 菜 单 栏 、 下 拉 菜 单 和 弹出 菜单 
Message 消息 控件 ， 用 来 显示 多 行文 本 ， 与 label 比较 类 似 
Radiobutton 单 选 按钮 控件 ， 显 示 一 个 单 选 按钮 的 状态 
Scale 范围 控件 ， 显 示 一 个 数值 刻度 ， 限 定 输出 的 数字 区 间 
Scrollbar 滚动 条 控件 ， 当 内 容 超过 可 视 化 区 域 时 使 用 ， 如 列表 框 
Text 文本 控件 ， 用 于 显示 多 行文 本 
Toplevel 容器 控件 ， 用 来 提供 一 个 单独 的 对 话 框 ， 和 Frame 比较 类 似 
Spinbox 输入 控件 ， 与 Entry 类 似 ， 但 是 可 以 指定 输入 范围 值 
PanedWindow 窗口 布局 管理 插件 ， 可 以 包含 一 个 或 者 多 个 子 控件 
LabelFrame 简单 的 容器 控件 ， 常 用 于 复杂 的 窗口 布局 
Messagebox 用 于 显示 应 用 程序 的 消息 框 
对 于 这 19 个 tkinter 控件 ， 此 处 对 Button、Checkbutton、Label、Text、Menu 等 有 代表 性 的 控 
tinge 其 他 控件 的 更 多 相关 信息 可 以 从 网 络 上 查找 或 访问 Python 官方 提供 的 GUI 教程 ， 教 
早上 有 GUI 各 控件 的 详细 描述 和 使 用 示例 ， 网 址 为 : https://www.tutorialspoint.com/python/python_ 


gu 


i_programming.htm 。 


16.3.1 Button 控件 


的 。 


隔 


Button 控件 用 于 在 Python 应 用 程序 中 添加 按钮 ， 可 以 用 文本 或 图 像 来 明确 标识 这 些 按钮 的 目 
可 以 在 单 击 按钮 时 自动 将 一 个 函数 或 方法 附加 到 一 个 按钮 上 。 

Button 控件 的 语法 如 下 : 

Ww = Button ( master, option=value, ... ) 

参数 master 表示 父 窗口 ，options 是 Button 控件 最 常用 的 选项 列表 ， 这 些 选项 可 以 是 用 逗号 分 


























的 键 值 对 。 表 16-2 列举 了 Button 控件 options 的 部 分 可 选 值 。 
表 16-2 Button 控件 的 部 分 可 选 值 

控件 描述 

activebackground 光标 选中 按钮 时 ， 指 定 按钮 的 背景 颜色 

activeforeground 光标 选中 按钮 时 ， 指 定 按钮 上 的 文本 颜色 

bg 指定 按钮 的 背景 色 

command 指定 按钮 消息 的 回调 函数 

但 指定 按钮 的 前 景 〈 文 本 ) 颜色 

font 指定 按钮 上 文本 的 字体 

height 指定 按钮 的 高 度 

width 指定 按钮 的 宽度 

padx 设置 文本 与 按钮 边框 x 的 距离 

pady 设置 文本 与 按钮 边框 y 的 距离 
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通过 如 下 示例 了 解 Button 控件 的 具体 使 用 方式 (button_exp.py) : 


from tkinter import Tk，Button 


top = Tk() # 创建 顶层 窗口 

text='hello world!' # 文本 内 容 为 hello world! 

bg='black' # 背景 为 黑色 

fg='white' # 文本 字体 为 白色 

font= ("黑体 "，20，"bold") # 文本 的 字体 

创建 一 个 按钮 ， 高 为 6， 宽 为 30， 文 本 内 容 为 hello world!， 黑 色 背 景 ， 白 色 黑 体 字体 ， 

大 小 20， 点 击 按钮 ， 背 景 变 为 红色 ， 字 体 为 绿色 ， 松 开 按钮 后 图 形 界面 退出 

bt tk = Button(top, text=text, height=6, width=30, command=top.quit, bg=bg, fg=fg, 
font=font, activebackground='red', activeforeground='green') 

pt_ tk.pack() “# 将 按钮 控件 放置 到 主 窗口 中 

top.mainloop() “# 进入 消息 循环 


执行 示例 代码 ， 得 到 如 图 16-2 所 示 的 结果 。 


‘Gtk ol x 


hello world! 





图 16-2 Button 示例 


16.3.2 ”Checkbutton 控件 


Checkbutton 控件 作为 切换 按钮 ， 用 于 向 用 户 显示 多 选项 。 用 户 可 以 通过 点 击 对 应 选项 的 按钮 
来 选择 一 个 或 多 个 选项 ， 也 可 以 用 图 片 代替 文 字 。 
Checkbutton 控件 的 语法 如 下 
w = Checkbutton ( master, option=value, ... ) 
参数 master 表示 父 窗口 ，options 是 Checkbutton 控件 最 常用 的 选项 列表 ， 这 些 选项 可 以 是 用 
2 分 隔 的 键 值 对 。 表 16-2 所 列举 的 Button 的 options 的 部 分 可 选 值 ，Checkbutton 也 都 有 ， 除 表 
6-2 所 示 的 可 选 值 外 ，Checkbutton 还 有 如 表 16-3 所 示 的 较 常 用 的 可 选 值 。 


表 16-3 Checkbutton 部 分 可 选 值 








控件 描述 
offvalue | 当 清除 关闭) 时，Checkbutton 的 关联 控制 变量 将 被 设置 为 0 
0 | 当 一 个 checkbutton 的 关联 控制 变量 被 选中 时 ， 它 将 被 设置 为 1 





selectcolor 设置 Checkbutton 按钮 的 颜色 


variable 按钮 当前 状态 的 控制 变量 ,是 一 个 mtVar,0 表 示 关 闭 (offvalue), 1 表示 选中 (onvalue) 
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通过 如 下 示例 了 解 Checkbutton 控件 的 具体 使 用 方式 〈checkbutton exp.py) : 


from tkinter import Tk, Checkbutton, IntVar 


top = Tk() 
check music = IntVar() # 定义 整数 变量 
check video = IntVar() 


创建 选择 按钮 ， 文 本 值 Music， 选 中 为 1， 清 除 选中 为 0， 背 景色 为 white， 
高 5， 宽 50， 选 择 框 颜色 为 red 


c m= Checkbutton(top, text="Music", variable=check music, onvalue=1, offvalue=0, 
bg='white', height=5, width=50, selectcolor='red') 

I 

创建 选择 按钮 ， 文 本 值 Video， 选 中 为 1， 清 除 选中 为 0， 背 景色 为 yellow， 

高 9， 宽 25， 选 择 框 颜色 为 blue 


I 
cv= Checkbutton(top, text="Video", variable=check video, onvalue=1, offvalue=0, 
bg='yellow', height=8, width=25, selectcolor='blue') 

c_m.pack() 
c_v.pack() 
top.mainloop() 


执行 示例 代码 ， 得 到 如 图 16-3 所 示 的 结果 。 
(tk EI x 





而 Music 


而 Video 














图 16-3 ”Checkbutton 示例 


16.3.3 ”Label 控件 


Label 控件 用 于 创建 一 个 显示 框 , 可 以 在 其 中 放置 文本 或 图 像 , 并 且 显 示 的 文本 可 以 随时 更 新 。 

Label 控件 的 语法 如 下 : 

w = Label ( master, option=value, … ) 

参数 master 表示 父 窗口 ，options 是 Label 控件 最 常用 的 选项 列表 。 表 16-2 所 列举 的 options 
的 可 选 值 ， 除 activebackground、activeforeground 和 command 外 ，Label 都 有 。 

通过 如 下 示例 了 解 Label 控件 的 具体 使 用 方式 〈label_exp.py) : 


from tkinter import Tk, StringVar, Label 
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top = Tk() 

var = StringVar() # 定义 字符 串 变量 

font= (" 黑 体 "，20，"bold") # 文本 的 字体 

定义 一 个 Label 控件 ， 文 本 内 容 可 变 ， 背 景 为 black， 文 本 为 white， 

黑体 20， 高 6， 宽 30 

label = Label (top, textvariable=var, bg='black', fg='white', 
font=font, height=6, width=30) 

var.set ("Hello,world!") 


label .pack () 
top.mainloop() 


执行 示例 代码 ， 得 到 如 图 16-4 所 示 的 结果 。 
dk 





Hello, world! 


图 164 Label 示例 


16.3.4 ”Text 控件 


Text 控件 提供 了 

Text 控件 的 语法 如 下 : 

w= Text ( master, option=value, ... ) 

参数 master 表示 父 窗口 ，options 是 Text 控件 最 常用 的 选项 列表 。 表 16-2 所 列举 的 Button 的 
options 的 可 选 值 ， 除 activebackground、activeforeground 和 command 外 ，Text 都 有 。 

通过 如 下 示例 了 解 Text 控件 的 具体 使 用 方式 〈text_exp.py) : 


from tkinter import Tk, Text, INSERT, END 


i 
WR 


行文 本 及 进行 格式 调整 ， 如 更 改 其 颜色 和 字体 。 





top = Tk() 
font= ("黑体 "，30，"bold") # 文本 的 字体 


定义 一 个 Text 控件 ， 高 5， 宽 30， 黑体 30， 背 景 为 white， 文 本 为 black 


text = Text (top, height=5, width=30, font=font, bg='white', fg='black') 
# 插入 文本 Hello, world! 

text .insert (INSERT, "Hello,world!") 

# 尾部 插入 文本 How are you? 

text .insert (END, "How are you?") 

text .pack() 


# 文本 标签 ， 标 签名 为 first，start index 为 0，end index 为 5， 标记 值 为 Hello 
text.tag_add("first"，"1.0"，"1.5") 
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# 文本 标签 ， 标 签名 为 second，start index 为 12，end index 为 17， 标 记 值 为 How a 
text .tag add("second", "1.12", "1.17") 

# 配置 标记 属性 ， 对 first 标记 的 属性 ， 设 置 背景 色 为 yellow, 文本 颜色 为 blue 
text.tag config("first", background="yellow", foreground="blue") 

# 配置 标记 属性 ， 对 second 标记 的 属性 ， 设 置 背景 色 为 black， 文 本 颜色 为 green 


text .tag config("second", background="black", foreground="green") 


top.mainloop() 


执行 示例 代码 ， 得 到 如 图 16-5 所 示 的 结果 。 


EO 





tk me 
Hello, wor 1d! 葬 re you? 











16-5 ”Text 示例 


16.3.5 ”Menu 控件 


Menu 控件 的 目标 是 使 用 各 种 菜单 创建 应 用 程序 。Menu 控件 的 核心 功能 提供 了 三 种 创建 菜单 
类 型 的 方法 : 弹出 式 、 顶 层 和 下 拉 式 。 

Menu 控件 的 语法 如 下 : 

Ww = Menu ( master, option=value, ... ) 

参数 master 表示 父 窗口 , options 是 Checkbutton 控件 最 常用 的 选项 列表 。 表 16-4 列举 了 Menu 
控件 options 的 部 分 可 选 值 。 


表 16-4 Menu 的 部 分 可 选 值 




















控件 描述 

activebackground 背景 颜色 

activeborderwidth 边框 宽度 ， 默 认 是 1 像素 

activeforeground 文本 颜色 

bg 指定 按钮 的 背景 色 

postcommand 可 以 将 此 选项 设置 为 一 个 过 程 ， 每 当 有 人 打开 这 个 菜单 时 ， 这 个 过 程 都 会 被 调用 
人 多 指定 按钮 的 前 景 〈 文 本 ) 颜色 

font 指定 按钮 上 文本 的 字体 

Selectcolor 选中 时 的 背景 

tearoff 分 窗 ，0 为 在 原 窗 ，1 为 点 击 分 为 两 个 窗口 





title 





如 果 想 要 更 改 该 窗口 的 标题 ， 可 将 标题 选项 设置 为 该 字符 串 


通过 如 下 示例 了 解 Menu 控件 的 具体 使 用 方式 (menu exp.py) : 


from tkinter import Tk, Menu 


win = Tk() 
# 添加 标题 
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执行 示例 代码 ， 得 到 如 图 16-6 所 示 的 结果 。 


二 


图 16-6 Menu 示例 
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16.4 tkinter 组 合 控件 


16.3 节 主 要 讲解 了 各 个 控件 的 语法 、 可 选 值 的 使 用 以 及 单个 控件 的 一 些 使 用 方式 。 本 节 将 通 
过 一 个 组 合 控件 的 使 用 来 加 强 对 各 个 控件 的 熟悉 。 

定义 一 个 resize0 回 调 函数 ， 该 函数 依附 于 Scale 控件 。 当 Scale 控件 的 滑 块 移动 时 ， 这 个 函数 
被 激活 ， 用 来 调整 Label 控件 中 的 文本 大 小 。 

定义 顶层 窗口 的 大 小 为 400*200。 定 义 一 个 Button， 当 点 击 该 按钮 时 退出 图 形 界面 。 定 义 
Menubutton 菜单 组 ， 并 实现 可 以 分 离 出 主 窗口 。 

根据 这 些 要 求实 现 示 例 代 码 如 下 (label_button_scale_menubutton.py): 


from tkinter import Tk, Button, Label, Scale, Menubutton, Menu 
from tkinter import X, Y, HORIZONTAL, LEFT 











# 回调 函数 
def resize (ev=None): 
label .config (font='Hello %d bold' $ scale.get()) 


top = Tk() 
top.title ("控件 组 合 ") 

top.geometry('400x200') 

label = Label (top, text='Hello World!', font='Helvetica -12 bold') 
label .pack (fill=Y, expand=]1) 


scale = Scale(top, from =10, to=40, orient=HORIZONTAL, command=resize) 
scale.set (12) 

# 绘画 界面 ，fil1=X，expand=1l 表示 可 以 被 撑 开 

scale.pack (fill=X, expand=]1) 


quit tk = Button(top, text="QUIT", command=top.quit, 
activeforeground='white', activebackground='red') 
quit tk.pack() 


mb lang = Menubutton(top, text ='Language') 


mb_lang.menu = Menu (mb lang) 

# 生成 菜单 项 

for item in ['Python', 'PHP', 'CPP', 'C', 'Java', 'JavaScript', 'VBScript']: 
mb_lang.menu.add command (label = item) 

mb_lang['menu'] = mb lang.menu 

mb_lang.pack(side = LEFT) 


# 向 菜单 中 添加 checkbutton 项 

mb_os = Menubutton (top，text ='0S') 

mb_os .menu = Menu (mb os) 

for item in ['Unix', 'Linux', 'Soloris', "Windows'] : 
mb_os .menu .add_checkbutton (label = item) 
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mb os['menu'] = mb_ os .menu 
mb os.pack(side = LEFT) 


# 向 菜单 中 添加 radiobutton 项 

mb linux = Menubutton (top, text ='Linux') 

mb linux.menu = Menu(mb linux) 

for item in ['Redhat', 'Fedra', 'Suse', ‘'ubuntu', 'Debian’']: 
mb linux.menu.add radiobutton (label = item) 

mb_linux['menu'] = mb_linux.menu 

mb linux.pack (side = LEFT) 


# 对 菜单 项 进行 操作 

# 向 Language 菜单 中 添加 一 项 "Ruby"， 以 分 隔 符 分 开 
mb lang.menu.add separator() 
mb_lang.menu.add_ command (label ='Ruby') 


# 向 OS 菜单 中 的 第 二 项 添加 "FreeBSD"， 以 分 隔 符 分 开 

mb os .menu.insert_separator (2) 

mb_os.menu.insert_ checkbutton(3, label ='FreeBSD') 
mb os.menu.insert separator (4) 


# 将 Linux 中 的 “Debian” 删 除 
mb_linux.menu.delete(5) 


top.mainloop() 


执行 示例 代码 ， 得 到 如 图 16-7 所 示 的 结果 。 








外 控件 组合 己 . 回 器 || uneusee。 [可 | os 
J a 
PP 
Hello World! 全 Pr 
c Limux 
二 Ed Soloris 
着 JavaScript Windows 
VBScript 
QUIT | 
| tanguage os Linux | 





























图 16-7 组 合 控 件 示 例 
16.5 ”牛刀 小 试 一 一 计算 器 开发 


设计 一 个 计算 器 ， 要 求实 现 以 下 功能 : 

(1) 需要 有 显示 区 和 下 拉 菜 单 。 

(2) 显示 按键 0~9。 

(3) 显示 常规 符号 按键 。 

(4) 实现 加 、 减 、 乘 、 除 、 取 余 、 求 倒数 、 开 平方 根 、 取 相反 数 等 操作 。 
(5) 鼠标 点 击 按键 时 ， 按 键 的 值 或 者 运算 结果 能 够 在 显示 区 显示 。 

(6) 能 够 清空 显示 区 ， 以 备 下 一 次 运算 输入 。 
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(7) 能 够 退 格 删除 显示 区 的 内 容 。 
(8) 对 于 被 除数 为 0， 可 以 做 异常 处 理 和 提示 。 


思路 分 析 : 


可 以 使 用 Button、Label 和 Menu，Button 用 于 按钮 控件 的 实现 ，Label 用 于 显示 区 的 实现 ， 
Menu 用 于 下 拉 菜 单 的 实现 ，Messagebox 用 于 提示 框 的 实现 。 

加 、 减 、 乘 、 除 、 取 余 、 求 倒数 、 开 平方 根 、 取 相反 数 等 操作 则 为 Python 的 逻辑 实现 。 

计算 过 程 中 出 现 异常 时 ， 通 过 异常 机 制 进行 处 理 ， 把 异常 信息 通过 Messagebox 展现 出 来 。 

实现 示例 代码 如 下 (calculator exp.py) : 
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fu_hao = self.an jian 
Print(fu hao) 

Print (result) 

Var_text .set (str(result)) 
cun_cu.clear () 


def bu ju(top_var) : 

global cun cu, var text, result, fu hao 

entryl = Label(top var, width=30, height=2, bg='white', anchor='se', 
textvariable=var text) 

entryl.grid(row=0, columnspan=5) 

button mc = Button(top var, text='MC', width=5) 

button mr = Button(top var, text='MR', width=5) 

button ms = Button(top var, text='MS', width=5) 

button ml = Button(top var, text='M+', width=5) 

button m2 = Button(top var, text='M-', width=5) 

button mc.grid(row=1,column=0) 

button mr.grid(row=1,column=1) 

button ms.grid(row=1,column=2) 

button ml.grid(row=1,column=3) 

button m2.grid(row=1,column=4) 


button j = Button(top var, text='*', width=5, command=AnJianZhi('c').tui) 
button ce = Button(top var, text='CE', width=5) 

button_c = Button(top_var, text=' C ', width=5, command=AnJianZhi('c') .clear) 
button12 = Button(top var, text='+', width=5, command=AnJianZzhi('c').zheng fu) 
button d = Button(top_var, text=' YJ', width=5, command=AnJianZhi('sqrt').yun_suan) 
button j.grid(row=2,column=0) 

button ce.grid(row=2,column=1) 

button c.grid(row=2,column=2) 

buttonl2.grid (row=2,column=3) 

button d.grid(row=2,column=4) 


button7 = Button(top var, text=' 7 ', width=5, command=AnJianZhi ('7') .jia) 
button8 = Button(top var, text=' 8 ', width=5, command=AnJianZhi('8') .jia) 
button9 = Button(top var, text=' 9 ', width=5, command=AnJianZhi('9') .jia) 
button c = Button(top_var, text=' / ', width=5, command=AnJianZhi('/') .yun_suan) 
button f = Button(top var, text=' $% ', width=5, command=AnJianZhi('%') .yun suan) 
button7.grid (row=3, column=0) 

button8 .grid (row=3, column=1) 

button9 .grid (row=3, column=2) 

button c.grid(row=3,column=3) 

button f.grid (row=3,column=4) 


button4 = Button(top var, text=' 4 ', width=5, command=AnJianZhi('4').jia) 
button5 = Button(top var, text=' 5 ', width=5, command=AnJianZhi('5') .jia) 
button6 = Button(top var, text=' 6 ', width=5, command=AnJianZhi('6') .jia) 
button x = Button(top var, text= 
button fs = Button(top var, text= 
button4 .grid (row=4, column=0) 
button5.grid (row=4, column=1) 
button6.grid (row=4, column=2) 
button x.grid(row=4,column=3) 
button fs.grid(row=4, column=4) 








* ', width=5, command=AnJianZhi('*') .yun suan) 





1/x', width=5, command=AnJianZzhi('1/x') .yun_suan) 
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16.6 调 试 


打开 网 址 https://www.tutorialspoint.com/python/python_gui_programming.htm， 根 据 本 章 所 学 ， 
找到 对 应 的 控件 , 仔细 查看 对 应 控件 的 文档 ， 并 逐个 尝试 该 控件 的 各 个 选项 值 ， 有 些 控件 提供 了 对 
应 的 方法 ， 练 习 提供 的 方法 的 使 用 方式 。 

GUI 工具 包 有 多 种 ， 工 具 包 的 基础 都 差不多 ， 不 过 当 学 习 如 何 使 用 一 个 新 的 包 时 ， 通 过 了 解 
所 有 的 细节 ， 而 后 找到 学 习 新 包 的 方法 ， 这 样 还 是 很 花 时 间 的 。 所 以 在 决定 使 用 哪个 工具 包 之 前 ， 
应 该 花 一 些 时 间 考 虑 ， 然 后 研究 文档 ， 接 着 不 断 coding。 


16.7 ”问题 解答 


(1) Python GUI 编程 选择 哪个 好 ? 
目前 比较 常用 的 Python GUI 有 tkinter、wxPython、Jython 三 种 ， 其 中 tkinter 是 Python 的 标准 
GUI 库 ， 可 以 快速 使 用 ，wxPython 是 跨 平台 的 ， 允 许 同一 个 程序 可 以 不 经 修改 地 在 多 种 平台 上 运 
行 ; Jython 是 一 种 完整 的 语言 ， 是 Python 语言 在 Java 中 的 完全 实现 ， 并 且 Jython 有 能 力 使 用 Java 
特别 的 安全 框架 。 
这 三 种 GUI 库 都 有 各 自 的 特点 ， 可 以 根据 自己 的 爱好 进行 选择 。 


(2) 如 何 快速 入 门 Python GUI 编程 ? 

在 这 里 先 借用 一 位 “大 牛 ” 的 一 句 话 : GUI 的 东西 应 该 会 很 难 ， 它 甚至 可 以 塑造 性 格 。 

这 句 话 就 是 告诉 我 们 ， 对 于 GUI 的 学 习 ， 并 没有 什么 捷径 ， 最 好 的 办 法 就 是 不 断 实战 、 不 断 
调试 、 不 断 尝试 ， 而 后 在 实战 过 程 中 不 断 分 析 与 总 结 。GUI 的 应 用 非常 考验 设计 能 力 ， 就 像 造 房 
子 ， 不 同 的 人 会 有 不 同 的 设计 ， 而 根据 不 同 的 设计 做 出 来 的 东西 就 会 千差万别 ， 最 直接 的 体现 就 是 
给 人 的 视觉 效果 有 所 不 同 。 


16.8 温 故 知 新 ， 学 以 致 用 


本 章 主 要 介绍 了 Python GUI 编程 中 Tk 的 一 些 控件 ， 在 本 章 结束 前 回顾 一 下 如 下 概念 : 
(1) 如 何 安装 tkinter? 
(2) Tk 中 有 哪些 控件 ? 
(3) Tk 中 各 个 控件 都 怎么 使 用 ， 有 哪些 特性 ? 
思考 并 解决 如 下 问题 : 
(1) 使 用 Canvas 控件 绘制 一 个 几何 图 形 。 
(2) 使 用 Listbox 控件 实现 选项 列表 的 展示 。 
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(3) 使 用 Message 控件 实现 多 行 消息 的 显示 ， 并 对 某 些 单词 做 颜色 标识 。 
(4) 使 用 RadioButton 控件 实现 单 选 ， 并 结合 其 他 控件 展示 所 选中 的 内 容 。 
(5) 挑选 对 应 控件 ， 实 现 简单 的 图 形 化 选择 性 试题 界面 ， 并 对 答题 结果 评分 。 
(6) 挑选 对 应 控件 ， 实 现 简单 的 五 子 棋 游戏 。 











(7) 挑选 对 应 控件 ， 实 现 简单 的 在 线 聊 天 。 





扫 码 看 视频 


国 基 站 加 





第 17 章 


操作 数据 库 


使 用 简单 的 纯 文 本 方式 只 能 实现 有 限 的 功能 ， 不 能 进行 快速 查询 ， 只 有 把 数据 全 部 读 到 内 存 
中 才能 自己 遍历 。 不 过 在 实际 应 用 中 , 我 们 操作 的 数据 大 小 经 常 远 远 超过 内 存 , 根本 无 法 全 部 读 入 
内 存 。 

为 了 便于 保存 程序 和 读 取 数 据 ， 并 直接 通过 条 件 快 速 查询 指定 的 数据 ， 于 是 出 现 了 数据 库 
(Database) 这 种 专门 用 于 集中 存储 和 查询 的 软件 。 

本 章 介 绍 在 Python 3.7 中 使 用 PyMySQL 连接 数据 库 ， 并 实现 简单 的 增 、 删 、 改 、 查 。 


17.1 数据库 介绍 


数据 库 历史 非常 久远 ， 早 在 1950 年 就 诞生 了 。 经 历 了 网 状 数据 库 、 层 次 数据 库 ， 我 们 现在 广 
泛 使 用 的 关系 数据 库 是 20 世纪 70 年 代 在 关系 模型 的 基础 上 诞生 的 。 

目前 ， 广 泛 使 用 的 关系 数据 库 分 为 付费 型 和 免费 型 。 付 费 型 数据 库 主要 有 以 下 几 种 : 

(1) Oracle， 收 费 昂贵 ， 产 品 确实 好 ， 当 前 很 多 大 型 公司 仍然 使 用 它 。 

(2) SQL Server， 微 软 自家 产品 ，Windows 定制 专款 。 

(3) DB2，IBM 的 产品 。 

(4) Sybase， 曾 经 跟 微 软 关 系 非常 亲密 ， 后 来 关系 破裂 ， 使 用 的 人 比较 少 了 ， 已 逐渐 淡出 大 
家 的 视野 。 


这 些 数据 库 都 是 不 开源 而 且 付费 的 ， 最 大 的 好 处 是 出 了 问题 可 以 找 厂家 解决 。 不 过 在 Web 的 
世界 里 ， 通 常 需要 部 署 成 千 上 万 数据 库 服务 器 ， 如 果 使 用 付费 型 数据 库 ， 赚 的 钱 都 会 被 拿 去 买 服务 
器 了 。 所 以 ， 无 论 是 Google、Facebook， 还 是 国内 的 BAT， 无 一 例外 都 选择 免费 的 开源 数据 库 。 
当前 流行 的 免费 数据 库 有 以 下 几 种 : 
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(1) MySQL， 当 前 使 用 最 为 广泛 的 开源 数据 库 。 
(2) PostgreSQL， 学 术 气 息 有 点 重 ， 其 实 挺 不 错 ， 不 过 知名 度 没有 MySQL 高 。 
(3) SQLite， 幅 入 式 数据 库 ， 适 合 桌 面 和 移动 应 用 。 


作为 Python 开发 工程 师 , 选择 哪 款 免费 数据 库 呢 ? 当然 是 MySQL.。 因为 MySQL 普及 率 最 高 ， 
出 了 错 可 以 很 容易 找到 解决 方法 ， 而 且 围绕 MySQL 有 很 多 监控 和 运 维 工具 ， 安 装 和 使 用 很 方便 。 

为 了 继续 后 面 的 学 习 , 你 需要 从 MySQL 官方 网 站 (http://www.mysqlcom ) 下 载 并 安装 MySQL 
Community Server。 

你 也 许 还 听 说 过 NoSQL 数据 库 ， 很 多 NoSQL 宣传 速度 和 规模 远 远 超 过 关系 数据 库 ， 是 否 有 
同学 觉得 有 了 NoSQL 就 不 需要 SQL 了 了 呢 ? 这 样 的 想法 是 错误 的 ， 在 搞 明 白 NoSQL 之 前 ， 需 要 先 
明白 SQL， 在 SQL 的 基础 上 学 习 NoSQL 很 容易 ， 反 过 来 就 不 行 了 。 

本 章 主 要 介绍 Python 如 何 操作 数据 库 ， 并 不 是 单纯 介绍 数据 库 ， 如 果 你 想 从 零 学 习 关系 数据 
库 和 基本 的 SQL 语句 ， 还 需要 查看 相关 资料 。 





17.2 Python 数据 库 API 


Python 数据 库 API 是 为 方便 统一 操作 数据 库 而 提出 的 一 个 标准 接口 ， 也 称 为 DB-API。 

在 没有 Python DB-API 之 前 ， 各 数据 库 之 间 的 应 用 接口 非常 混乱 ， 实 现 各 不 相同 。 如 果 项 目 
需要 更 换 数据 库 ， 就 需要 进行 大 量 修改 , 非常 不 便 。 Python DB-API 的 出 现 就 是 为 了 解决 这 些 问题 。 

Python 所 有 数据 库 接口 程序 都 在 一 定 程度 上 遵守 Python DB-API 规范 。DB-API 定义 了 一 系列 
必需 的 对 象 和 数据 库存 取 方 式 , 以 便 为 各 种 各 样 的 底层 数据 库 系 统 和 数据 库 接口 程序 提供 一 致 的 访 
问 接口 。 由 于 DB-API 为 不 同 数据 库 提供 了 一 致 的 访问 接口 ,因此 在 不 同 的 数据 库 之 间 移 植 代码 成 
为 一 件 轻松 的 事情 。 

DB-API 规范 包括 全 局 变量 、 异 常 、 连 接 、 游 标 和 类 型 等 基本 概念 ， 下 面 我 们 逐一 进行 介绍 。 


17.2.1 全 局 变量 


DB-API 规范 规定 数据 库 接口 模块 必须 实现 一 些 全 局 属性 以 保证 兼容 性 。 Python 提供 了 3 个 描 
述 数据 库 模块 特性 的 全 局 变量 ， 如 表 17-1 所 示 。 


表 17-1 Python DB-API 模块 特性 全 局 变量 














变量 名 用 途 

apilevel 所 使 用 的 Python DB-API 的 版 本 
threadsafety 模块 的 线程 安全 等 级 

paramstyle 在 SQL 查询 中 使 用 的 参数 风格 


apilevel 指 的 是 API 级 别 ， 是 一 个 字符 串 常 量 ， 表 示 这 个 DB-API 模块 所 兼容 的 DB-API 最 高 
的 版 本 号 。 例 如 ， 若 版 本 号 是 1.0、2.0， 则 最 高 版 本 是 2.0， 如 果 未 定义 ， 就 默认 是 1.0。 
线程 安全 等 级 threadsafety 是 一 个 整数 ， 取 值 范 围 如 下 : 
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0 表示 不 支持 线程 安全 ， 多 个 线程 不 能 共享 此 模块 。 

1 表示 初级 线程 安全 支持 ， 线 程 可 以 共享 模块 ， 但 不 能 共享 连接 。 

2 表示 中 级 线程 安全 支持 ， 线 程 可 以 共享 模块 和 连接 ， 但 不 能 共享 游标 。 

3 表示 完全 线程 安全 支持 ， 线 程 可 以 共享 模块 、 连 接 及 游标 。 

paramstyle〈 参 数 风格 ) 表示 执行 多 次 类 似 查 询 时 ， 参 数 如 何 被 拼接 到 SQL 查询 中 。 值 format 
表示 标准 字符 串 格式 化 (使 用 基本 的 格式 代码 ), 可 以 在 参数 中 进行 拼接 的 地 方 插入 %s。 值 pyformt 
表示 扩展 的 格式 代码 ， 用 于 字典 拼接 ， 如 % (foo) 。 除 了 Python 风格 之 外 ， 还 有 3 种 接合 方式 : 
qmark 的 意思 是 使 用 问号 ，numeric 表示 使 用 :1 或 :2 格式 的 字段 (数字 表示 参数 的 序号 ) ,而 named 
表示 :foobar 这 样 的 字段 。 其 中 ，foobar 为 参数 名 。 








17.2.2 ”异常 


为 了 能 尽 可 能 准确 地 处 理 错 误 ，DB-API 中 定义 了 一 些 异 常 。 这 些 异 常 被 定义 在 层次 结构 中 ， 
可 以 通过 一 个 except 块 捕捉 多 种 异常 。 
异常 的 层次 如 表 17-2 所 示 。 


表 17-2 DB-API 常 见 异常 























异常 超 类 描述 

StandardError 所 有 异常 的 泛 型 基 类 
Waming StandardError 在 非 致 命 错误 发 生 时 引发 
Error StandardError 错误 异常 基 类 
InterfaceError Error 数据 库 接口 错误 
DatabaseError Error 与 数据 库 相 关 的 错误 基 类 
DataError DatabaseError 处 理 数 据 时 出 错 
OperationalError DatabaseError 数据 库 执行 命令 时 出 错 
IntegrityError DatabaseError 数据 完整 性 错误 
IntemalError DatabaseError 数据 库 内 部 出 错 
ProgrammingError DatabaseError SQL 执行 失败 
NotSupportedError DatabaseError 试图 执行 数据 库 不 支持 的 特性 


17.2.3 ”连接 和 游标 


为 了 使 用 基础 数据 库 系统 ， 首 先 必须 连接 它 。 连 接 数据 库 需 要 使 用 具有 恰当 名 称 的 connect 函 
数 。 该 函数 有 多 个 参数 ， 具 体 使 用 哪个 参数 需要 根据 数据 库 类 型 进行 选择 。DB-API 定义 了 表 17-3 
所 示 的 参数 作为 准则 (建议 将 这 些 参 数 按 表 中 给 定 的 顺序 传递 ) ， 参 数 类 型 为 字符 串 类 型 。 
表 17-3 ”connect 函数 常用 参数 
参数 名 描述 是 否 可 选 
dsn | 数据 源 名 称 ， 给 出 该 参数 表示 数据 库 依赖 | 否 
user 用 户 名 是 
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( 续 表 ) 
参数 名 描述 是 否 可 选 
password | 用 户 密码 | 是 
host | 主机 名 | 是 
database 数据 库 名 称 是 


connect 函数 返回 连接 对 象 ， 这 个 连接 对 象 表示 目前 和 数据 库 的 会 话 。 连 接 对 象 支持 的 方法 如 


表 17-4 所 示 。 





表 17-4 连接 对 象 支持 的 方法 























方法 名 描述 

close() 关闭 连接 后 ， 连 接 对 象 和 它 的 游标 均 不 可 用 
commitO 如 果 支 持 就 提交 挂 起 的 事务 ， 否 则 不 做 任何 事 
rollback() 回 滚 挂 起 的 事务 〈 可 能 不 可 用 ) 

cursor() 返回 连接 的 游标 对 象 





rollback 方法 可 能 不 可 用 ， 因 为 不 是 所 有 数据 库 都 支持 事务 。 

commit 方法 总 是 可 用 的 ， 不 过 如 果 数 据 库 不 支持 事务 ， 它 就 没有 任何 作用 。 

cursor 方法 指 游 标 对 象 。 通 过 游标 执行 SQL 查询 并 检查 结果 。 游 标 比 连接 支持 更 多 方法 ， 而 
且 在 程序 中 更 好 用 。 表 17-5 是 游标 方法 的 概述 ， 表 17-6 是 游标 特性 的 概述 。 


表 17-5 游标 对 象 方法 











名 称 描述 

callproc(func[,args]) 使 用 给 定 的 名 称 和 参数 〈 可 选 ) 调用 已 命名 的 数据 库 程序 
close() 关闭 游标 后 ， 游 标 不 可 用 

execute(op[,args]) 执行 SQL 操作 ， 可 能 使 用 参数 


executemany(op,args) 对 序列 中 的 每 个 参数 执行 SQL 操作 














fetchone() 把 查询 结果 集中 的 下 一 行 保存 为 序列 或 None 
fetchmany([size]) 获取 查询 结果 集中 的 多 行 ， 默 认 尺寸 为 arraysize 
fetchall0 将 所 有 《剩余 ) 行 作为 结果 序列 

nextset() 调 至 下 一 个 可 用 的 结果 集 ( 可 选 ) 
setinputsizes(sizes) 为 参数 预先 定义 内 存 区域 
setoutputsize(size[,col]) 为 获取 大 数据 值 设 定 缓 冲 区 尺寸 


表 17-6 游标 对 象 特性 














名 称 描述 
arraysize fetchmany 中 返回 的 行 数 ， 只 读 
description 结果 列 描述 的 序列 ， 只 读 
TOWCcount 结果 中 的 行 数 ， 只 读 
游标 对 象 最 重要 的 属性 是 execute*() 和 fetch*() 方 法 .所 有 对 数据 库 服务 器 的 请 求 都 由 这 两 个 方 











法 完成 。 对 fetchmany() 方 法 来 说 ， 设 置 一 个 合理 的 arraysize 属性 很 有 有用。 当然 ， 在 不 需要 时 最 好 


关 掉 游 标 对 象 。 
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17.2.4 ”类 型 


每 一 个 插入 数据 库 中 的 数据 都 对 应 一 个 数据 类 型 ， 每 一 列 数据 对 应 同一 个 数据 类 型 ， 不 同 列 
对 应 不 同 的 数据 类 型 。 在 操作 数据 库 的 过 程 中 ， 为 了 能 够 正确 与 基础 SQL 数据 库 进行 数据 交互 操 
作 ,，DB-API 定义 了 用 于 特殊 类 型 和 值 的 构造 函数 及 常量 , 所 有 模块 都 要 求实 现 表 17-7 所 示 的 构造 


























函数 和 特殊 值 。 

表 17-7 “DB-API 构造 函数 和 特殊 值 
构造 函数 和 特殊 值 的 名 称 描述 
Date(yrmo,dy) 日 期 值 对 象 
Time(hr,min,sec) 时 间 值 对 象 
Timestamp(yr,mo,dy, hr min,sec) 时 间 稚 对象 
DateFromTicks(ticks) 创建 自 新 纪元 以 来 秒 数 的 对 象 
TimeFromTicks(ticks) 创建 自 新 纪元 以 来 秒 数 的 时 间 值 对 象 
TimestampFromTicks(ticks) 创建 自 新 纪元 以 来 秒 数 的 时 间 戳 值 对 象 
Binary(string) 对 应 二 进 制 长 字符 串 值 对 象 
STRING 描述 字符 串 列 对 象 ， 如 VARCHAR 
BINARY 描述 二 进 制 长 列 对 象 ， 如 RAW、BLOB 
NUMBER 描述 数字 列 对 象 
DATETIME 描述 日 期 时 间 列 对 象 
ROWID 描述 row ID 列 对 象 


注 : 新 纪元 指 1970-01-01 00:00:01 ute 时 间 





17.3 ”数据库 操作 


前 面 我 们 介绍 了 数据 库 的 基本 概念 ， 本 节 具 体 介绍 数据 库 的 连接 及 增 、 删 、 改 、 查 操作 。 

下 面 的 示例 数据 库 为 TEST， 表 名 为 EMPLOYEE，EMPLOYEE 表 字段 为 FIRST NAME、 
LAST_NAME、AGE、SEX、INCOME 和 CREATE TIME。 

连接 数据 库 TEST 使 用 的 用 户 名 为 root， 密 码 为 root。 

在 系统 上 已 经 安装 了 Python PyMySQL 模块 。 若 不 知道 怎么 安装 ， 则 可 查阅 相关 资料 。 

如 果 对 SQL 语句 不 熟悉 ， 就 要 先 了 解数 据 库 的 一 些 基本 操作 ， 以 方便 更 好 地 理解 接 下 来 的 内 容 。 


17.3.1 数据 库 连 接 


下 面 是 连接 MySQL TEST 数据 库 的 实例 (db_connectpy) 。 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 
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车 import pymysql 报错 ， 则 需要 安装 pymysql。 执 行 结果 如 下 : 
Database version :5.5.28 


17.3.2 ”创建 数据 库 表 


如 果 数 据 库 连 接 存 在 , 我 们 就 可 以 使 用 execute0 方 法 为 数据 库 创建 表 。 创建 表 EMPLOYEE 的 
代码 如 下 (create_table.py) : 
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except Exception as ex: 

Print (f"CRERTE TABLE FAILED,CASE: {ex}") 
finally: 

# 关闭 数据 库 连接 

db.close() 


def main(): 
create table() 


if _name ==" main nm: 
main () 


执行 结果 如 下 : 
CREATE TABLE SUCCESS. 
从 MySQL 客户 端 查 看 表 结 构 ， 如 图 17-1 所 示 。 


1> desc employee 


FIRST_NAME char(29> 
LAST_NAME char(29> 


hGE int C11> 
SEX charct> 
INCOME float 
CREATE_TIME datetime 


6 rows in set (0.87 sec)》 





图 17-1 EMPLOYEE 表 结构 


17.3.3 ”数据 库 插入 





下 面 使 用 SQL INSERT 语句 向 表 EMPLOYEE 插入 记录 (注意 使 用 了 datetime 模块 ) 


(insert record.py) 。 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


import pymysql 
import datetime 


def insert record(): 
db = pymysql.connect ("localhost", "root", "root", "test") 


# 使 用 cursor() 方 法 获取 操作 游标 


cursor = db.cursor () 


# SQL 插入 语句 
sql = "INSERT INTO EMPLOYEE (FIRST NAME,LAST NAME, AGE, SEX, INCOME," \ 
" CREATE TIME) VALUES('%s', '%s', %d, '%c', %d, '%s')" \ 
多 ('xiao', 'zhi', 22, 'M', 30000, datetime.datetime.now()) 
try: 
# 执行 SQL 语句 
cursor.execute (sql) 
# 提交 到 数据 库 执行 
db .commit() 
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print ("INSERT SUCCESS .") 
except Exception as ex: 


Print (f'INSERT INTO MySQL table failed.Case: {ex}') 


# 如 果 发 生 错误 就 回 滚 
db.rollback () 
finally: 
# 关闭 数据 库 连接 
db.close() 


def main(): 


if _ name == 


insert_record () 
wn le 


main () 


执行 结果 如 下 : 


INSERT SUCCESS. 


从 MySQL 客户 端 查看 表 插 入 结果 ， 如 图 17-2 所 示 。 


nysql> select * from employees; 
HR LAST_NAME 


AG 





图 17-2 插入 数据 结果 


17.3.4 ”数据 库 查询 


Python 查询 MySQL 使 用 fetchone() 方 法 获取 单条 数据 ， 使 用 fetchall() 方 法 获取 多 条 数据 。 


fetchone(): 该 方法 获取 下 一 个 查询 结果 集 。 结 果 集 是 一 个 对 象 。 


下 面 的 示例 用 于 查询 EMPLOYEE 表 中 salary ( 工 


fetchall(): 接收 全 部 返回 结果 行 。 


rowcount: 这 是 一 个 只 读 属性 ， 返 回执 行 execute() 方 法 后 影响 的 行 数 。 


(query data.py) 。 


#1! 


/usr/bin/python 


# =*=c0d4ng:UTF=8=*= 


import pymysql 


def query data(): 


# 打开 数据 库 连接 


db = pymysql.connect ("localhost", "root", "root", 


# 使 用 cursor() 方 法 获取 操作 游标 


cursor = db.cursor () 


# SQL 查询 语句 


4 


资 ) 字段 大 于 


"test") 


sql = "SELECT * FROM EMPLOYEE WHERE INCOME > %d" 当 10000 


10000 的 所 有 数据 
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执行 结果 如 下 : 


17.3.5 “数据库 更 新 


下 面 的 示例 将 EMPLOYEE 表 中 SEX 字段 值 为 M' 的 记录 的 AGE 字段 值 增 加 1 
Cupdate table.py) : 
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db.commit () 
print ("UPDATE SUCCESS.") 
except Exception as ex: 
print(f'UPDATE MySQL table failed.Case:{ex}') 
# 发 生 错 误 时 回 滚 
db.rollback() 
finally: 
# 关闭 数据 库 连接 
db.close() 


def main() : 
update table () 


执行 结果 如 下 : 
UPDATE SUCCESS . 


从 MySQL 客户 端 查看 更 新 结果 ， 如 图 17-3 所 示 。 可 以 发 现 ，AGE 变 为 23 了 。 


1 INCOME ! CREATE_TIME 


A 


1 39608 ! 2918-63-13 29:44:49 }! 


由 


i row in set 0.88 sec)» 





ysql> 


图 17-3 表 更 新 结果 


17.3.6 ”数据 库 删 除 


删除 操作 用 于 删除 数据 表 中 对 应 的 数据 。 

下 面 演示 删除 数据 表 EMPLOYEE 中 AGE 大 于 22 的 所 有 数据 〈delete record.py) 。 
#! /usr/bin/python 

# -*-coding:UTE-8-*- 


import pymysql 


def delete record(): 
# 打开 数据 库 连接 


db = pymysql.connect ("localhost", "root", "root", "test") 


# 使 用 cursor() 方 法 获取 操作 游标 


cursor = db.cursor() 


# SQL 删除 语句 
sql = "DELETE FROM EMPLOYEE WHERE AGE > $%d" $%$ 22 
try: 


# 执行 SoL 语句 
cursor.execute (sql) 
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# 提交 修改 
db .commit() 
print ("DELETE SUCCESS.") 
except Exception as ex: 
Print (f"DELETE RECORD FAILED.Case:{ex}") 
# 发 生 错 误 时 回 滚 
db.rollback() 
finally: 
# 关闭 连接 
db.close() 


def main(): 
delete record() 


if _name ==" main_": 


main() 
执行 结果 如 下 : 


DELETE SUCCESS. 


从 MySQL 客户 端 查看 删除 结果 ， 如 图 17-4 所 示 。 可 以 看 到 ， 之 前 插入 的 一 条 数据 被 删除 了 。 


ysql> select x from employee; 
lIEnpty set 0@.00 sec» 





ysql> 
174 ”记录 删除 


17.4 事 务 


事务 机 制 可 以 确保 数据 的 一 致 性 。 
事务 具有 4 个 属性 : 原子 性 (Atomicity) 、 一 致 性 〈Consistency) 、 隔 离 性 〈Isolation) 、 持 
久 性 〈Durability) ， 这 4 个 属性 通常 称 为 ACID 特性 。 

原子 性 : 一 个 事务 是 一 个 不 可 分 割 的 工作 单位 ， 事 务 中 的 所 有 操作 要 么 都 做 ， 要 么 都 不 做 。 
一 致 性 : 事务 必须 使 数据 库 从 一 个 一 致 性 状态 变 为 另 一 个 一 致 性 状态 。 一 致 性 与 原子 性 是 密 
切 相关 的 。 

@ ”隔离 性 : 一 个 事务 的 执行 不 能 被 其 他 事务 干扰 。 也 就 是 一 个 事务 内 部 的 操作 及 使 用 的 数据 对 
并 发 的 其 他 事务 是 隔离 的 ， 并 发 执行 的 各 个 事务 之 间 不 能 互相 干扰 。 

@ 持久 性 : 持久 性 也 称 永 久 性 (Permanence )， 指 一 个 事务 一 旦 提交 ， 它 对 数据 库 中 数据 的 改变 
就 应 该 是 永久 性 的 。 接 下 来 其 他 操作 或 故障 不 应 该 对 其 有 任何 影响 。 





Python DB-API 2.0 的 事务 提供 了 两 个 方法 ， 即 commit 和 rollback。 前 面 删除 方法 中 的 一 段 代 
码 就 使 用 了 事务 (前 面 的 插入 、 更 新 都 使 用 了 事务 〉: 


# SQL 删除 记录 语句 
sql = "DELETE FROM EMPLOYEE WHERE AGE > %d" % 22 
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try: 
# 执行 SoL 语句 
cursor.execute (sql) 
# 提交 修改 
db .commit() 
Print ("DELETE SUCCESS.") 
except Exception as ex: 
print (f"DELETE RECORD FAILED.Case:{ex}") 
# 发 生 错 误 时 回 滚 
db.rollback() 
finally: 
# 关闭 连接 
db.close() 
在 Python 数据 库 编程 中 ， 支 持 事务 的 数据 库 在 游标 建立 时 会 自动 开始 一 个 隐形 数据 库 事务 。 
commit() 方 法 提交 所 有 更 新 操作 ，rollback() 方 法 回 滚 当前 游标 的 所 有 操作 。 每 一 个 方法 都 开启 
一 个 新 事务 。 


17.5 调 试 


初学 者 跟 数 据 库 打 交道 时 很 容易 碰 到 形形色色 的 问题 ， 可 能 一 个 非常 简单 的 问题 也 会 导致 你 
无 法 找到 问题 所 在 。 此 时 我 们 需要 处 理 以 下 儿 个 问题 : 

(1) 程序 中 有 没有 我 们 期 望 去 做 却 没 有 实现 的 功能 ? 找到 运行 该 功能 的 代码 ， 并 确保 这 段 代 
码 如 你 所 期 望 地 运行 了 。 

(2) 程序 中 有 没有 运行 某 种 不 该 出 现 的 功能 的 代码 ? 

(3) 有 没有 一 段 代 码 产生 的 效果 和 你 所 期 望 的 不 一 致 ?确保 你 完全 明白 这 段 代 码 ， 特 别 是 牵 
涉 对 其 他 Python 模块 的 函数 或 方法 调用 时 。 阅 读 调用 到 的 函数 的 文档 ， 使 用 简单 的 测试 用 例 测试 
它们 并 检查 结果 。 


为 了 能 够 编程 ， 我 们 需要 对 程序 如 何 工作 有 一 个 思维 模型 。 如 果 编 写 了 一 段 和 你 预料 不 同 的 
代码 ， 问 题 常常 在 于 你 的 思维 模型 。 

修正 思维 模型 的 最 佳 方法 是 将 程序 划分 成 不 同 的 部 分 (通常 是 函数 和 方法 ) ， 并 独立 测试 每 
一 个 部 分 。 一 旦 找到 模型 和 真实 世界 的 偏差 ， 就 能 够 解决 问题 。 

在 开发 过 程 中 应 当 分 组 件 进行 构建 和 测试 。 当 发 现 一 个 问题 时 ， 只 需要 检查 一 小 部 分 不 确认 
是 否 正确 的 代码 即 可 。 


17.6 ”问题 解答 


(1) Python 新 手 入 门 使 用 哪 种 数据 库 比较 好 ? 
答 : 建议 使 用 MySQL， 现 在 中 小 企业 用 得 多 ， 大 企业 也 在 用 。MySQL 免费 、 开 源 ， 而 且 好 
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用 ， 比 其 他 企业 级 数据 库 轻 量 了 不 少 。 


(2) 实际 应 用 开发 中 ， 数 据 库 操作 用 得 多 吗 ? 

答 : 数据 库 作 为 数据 存储 的 基本 载体 ， 在 信息 时 代 是 信息 系统 中 最 基本 的 组 成 部 分 。 正 如 本 
童 所 讲 的 , 文件 能 存储 数据 ， 但 是 存储 能 力 有 限 ， 而 数据 库 无 论 对 任何 规格 的 数据 ， 存 储 能 力 都 远 
在 文件 之 上 。 数 据 库 一 般 有 标准 API, 访问 比较 快速 和 高 效 。 在 实际 应 用 中 ， 对 数据 的 操作 基本 优 
先 考虑 使 用 数据 库 。 


17.7 温 故 知 新 ， 学 以 致 用 


本 章 主 要 介绍 了 创建 和 关系 型 数据 库 交 互 的 Python 程序 , 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 
(1) Python DB-API 提供 了 哪些 简单 、 标 准 化 的 接口 ? 

(2) 数据 库 的 增 、 删 、 改 、 查 怎么 操作 ? 

(3) 什么 叫 事务 ， 事 务 有 哪些 特性 ? 

思考 并 解决 如 下 问题 : 

(1) 创建 一 张 表 ， 自 己 定义 字段 ， 字 段 尽 量 包 含 多 种 类 型 。 

(2) 向 表 中 插入 多 条 数据 ， 并 尝试 从 文件 中 读 取 数据 插入 数据 库 。 

(3) 对 某 些 字段 进行 求 和 、 求 平均 值 、 分 组 、 排 序 等 操作 。 





小 程序 资源 二 维 码 





扫 码 看 视频 





项 目 实战 一 一 扑 虫 


前 面 音节 讲述 了 Python 中 的 基础 知识 ， 接 下 来 使 用 所 学 的 知识 进行 实战 练习 。 本 童 将 讲解 一 
个 实战 项 目 一 一 仆 虫 的 实现 。 


18.1 了 解 怜 虫 


疏 虫 5 网 络 朴 虫 ) ， 大 家 可 以 理解 为 在 网 络 上 扑 行 的 一 种 蜂 蛛 ， 互 联网 就 像 一 张大 网 ， 扑 虫 
就 是 在 这 张 网 上 扑 来 假 去 的 蜂 蛛 。 如 果 扑 虫 遇 到 资源 ， 就 会 将 资源 抓 取 下 来 。 至 于 抓 取 什么 资源 ， 
这 个 由 用 户 控制 。 

例如 ， 疏 虫 抓 取 了 一 个 网 页 ， 在 这 个 网 页 中 发 现 了 一 条 道路 ， 也 就 是 指向 网 页 的 超 链接 ， 它 
就 可 以 爬 到 另 一 张 网 上 获取 数据 。 这样， 整个 连 在 一 起 的 大 网 对 这 只 蜘蛛 来 说 触手 可 及 ， 分 分 钟 耻 
下 来 不 是 事 儿 。 

在 用 户 浏览 网 页 的 过 程 中 ,我 们 可 能 会 看 到 许多 好 看 的 图 片 ， 比 如 输入 百度 的 网 址 进入 首页 后 ， 
我 们 会 看 到 几 张 图 片 和 百度 搜索 框 ， 其 实 是 在 用 户 输入 网 址 后 ， 经 过 DNS 服务 器 找到 服务 器 主机 ， 
向 服务 器 发 出 一 个 请 求 ， 经 过 服务 器 解析 后 ， 发 送 给 用 户 浏览 器 HTML、JS、CSS 等 文件 ， 再 经 过 
浏览 器 解析 ， 用 户 便 可 以 看 到 形形色色 的 图 片 了 。 

用 户 看 到 的 网 页 实际 上 是 由 HTML 代码 构成 的 ， 怜 虫 疏 来 的 便 是 这 些 内 容 ， 通 过 分 析 和 过 滤 
这 些 HTML 代码 ， 实 现 对 图 片 、 文 字 等 资源 的 获取 。 

在 资源 抓 取 过 程 中 需要 使 用 URL 做 资源 定位 。URL (统一 资源 定位 符 ) 就 是 我 们 所 说 的 网 址 ， 
URL 是 对 可 以 从 互联 网 上 得 到 资源 位 置 和 访问 方法 的 一 种 简洁 的 表示 ， 是 互联 网 上 标准 资源 的 地 
址 。 互 联网 上 每 个 文件 都 有 唯一 的 URL，URL 包含 的 信息 指出 文件 的 位 置 和 浏览 器 应 该 怎么 处 理 
这 个 URL。 

URL 的 格式 由 以 下 3 部 分 组 成 : 
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(1) 协议 〈 服 务 方式) 。 
(2) 存 有 该 资源 的 主机 IP 地 址 (有 时 也 包括 端口 号 ) 。 
(3) 主机 资源 的 具体 地 址 ， 如 目录 和 文件 名 等 。 


疏 虫 疏 取 数据 时 必须 有 目标 URL 才 可 以 获取 数据 ， 因 此 URL 是 怜 虫 获取 数据 的 基本 依据 ， 
准确 理解 URL 的 含义 对 学 习 仆 虫 有 很 大 帮助 。 





18.2 ”有 疏 虫 的 原理 


疏 虫 的 原理 是 ， 从 一 个 起 始 种 子 链接 开始 ， 发 送 HTTP 请 求 这 个 链接 ， 得 到 该 链接 中 的 内 容 ， 
然后 大 多 正则 匹配 页 面 里 的 有 效 链接 , 然后 将 这 些 链接 保存 到 待 访问 队列 中 , 等 待 假 取 线程 取 这 个 
待 访问 队列 , 一旦 链接 已 访问 , 为 了 有 效 减 少 不 必 要 的 网 络 请 求 , 我 们 把 已 访问 的 链接 放 到 已 访问 
Map 中 ， 防 止 重 复 抓 取 和 死 循环 。 以 上 提 到 的 是 一 个 比较 简单 的 爬虫 实现 过 程 ， 还 有 更 复杂 的 疏 
虫 ， 如 需要 使 用 代理 服务 器 、 伪 装 成 浏览 器 、 登 录 和 提取 验证 码 等 。 这 里 面 有 两 个 概念 ， 一 个 是 发 
送 HTTP 请 求 ， 另 一 个 是 正则 匹配 你 感 兴趣 的 链接 。 

疏 虫 的 原理 相对 简单 ， 疏 取 网 页 的 基本 步骤 如 下 : 

301 人 工 给 定 一 个 URL 作为 入 口 ， 从 这 里 开始 肛 取 。 

万 维 网 的 可 视图 呈 蝴 蝶 型 ， 网 络 息 虫 一 般 从 蝴蝶 型 左边 出 发 。 这 里 有 一 些 门 户 网 站 的 主页 ， 而 
门户 网 站 中 包含 大 量 有 价值 的 链接 。 

C02 用 运行 队列 和 完成 队列 保存 不 同 状态 的 链接 。 

对 于 大 型 数据 而 言 ， 内 存 中 的 队列 是 不 够 的 ， 通 常 采 用 数据 库 模拟 队列 。 用 这 种 方法 既 可 以 进 
行 海量 数据 的 抓 取 ， 又 可 以 拥有 断 点 续 抓 功能 。 

2703 线程 从 运行 队列 读 取 队 首 URL， 如 果 存 在 ， 就 继续 执行 ， 反 之 停止 的 取 。 

O704 每 处 理 完 一 个 URL ， 将 其 放 入 完成 队列 ， 防 止 重复 访问 。 

人 5 每 次 抓 取 网 页 之 后 分 析 其 中 的 URL, 将 经 过 过 滤 的 合法 链接 写 入 运行 队列 ,等 待 提取 。 

人 6 重复 步骤 03、 步 又 04 和 步骤 05。 











18.3 ” 疏 虫 常用 的 几 种 技巧 


Python 的 网 络 爬 取 方式 有 很 多 种 ， 下 面 介绍 常用 的 几 种 网 络 爬 取 方 式 。 


18.3.1 基本 方法 


Python 中 基本 的 网 络 怜 取 几 行 代码 就 可 以 实现 ， 只 需 使 用 urllib 模块 中 的 request 即 可 。 我 们 
在 第 15 章 网 络 编程 中 已 经 有 相关 实现 ， 代 码 如 下 〈exp_requestpy) : 
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(1) 协议 〈 服 务 方式) 。 
(2) 存 有 该 资源 的 主机 IP 地 址 (有 时 也 包括 端口 号 ) 。 
(3) 主机 资源 的 具体 地 址 ， 如 目录 和 文件 名 等 。 


疏 虫 疏 取 数据 时 必须 有 目标 URL 才 可 以 获取 数据 ， 因 此 URL 是 怜 虫 获取 数据 的 基本 依据 ， 
准确 理解 URL 的 含义 对 学 习 仆 虫 有 很 大 帮助 。 





18.2 ”有 疏 虫 的 原理 


疏 虫 的 原理 是 ， 从 一 个 起 始 种 子 链接 开始 ， 发 送 HTTP 请 求 这 个 链接 ， 得 到 该 链接 中 的 内 容 ， 
然后 大 多 正则 匹配 页 面 里 的 有 效 链接 , 然后 将 这 些 链接 保存 到 待 访问 队列 中 , 等 待 假 取 线程 取 这 个 
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虫 ， 如 需要 使 用 代理 服务 器 、 伪 装 成 浏览 器 、 登 录 和 提取 验证 码 等 。 这 里 面 有 两 个 概念 ， 一 个 是 发 
送 HTTP 请 求 ， 另 一 个 是 正则 匹配 你 感 兴趣 的 链接 。 

疏 虫 的 原理 相对 简单 ， 疏 取 网 页 的 基本 步骤 如 下 : 

301 人 工 给 定 一 个 URL 作为 入 口 ， 从 这 里 开始 肛 取 。 

万 维 网 的 可 视图 呈 蝴 蝶 型 ， 网 络 息 虫 一 般 从 蝴蝶 型 左边 出 发 。 这 里 有 一 些 门 户 网 站 的 主页 ， 而 
门户 网 站 中 包含 大 量 有 价值 的 链接 。 

C02 用 运行 队列 和 完成 队列 保存 不 同 状态 的 链接 。 

对 于 大 型 数据 而 言 ， 内 存 中 的 队列 是 不 够 的 ， 通 常 采 用 数据 库 模拟 队列 。 用 这 种 方法 既 可 以 进 
行 海量 数据 的 抓 取 ， 又 可 以 拥有 断 点 续 抓 功能 。 

2703 线程 从 运行 队列 读 取 队 首 URL， 如 果 存 在 ， 就 继续 执行 ， 反 之 停止 的 取 。 

O704 每 处 理 完 一 个 URL ， 将 其 放 入 完成 队列 ， 防 止 重复 访问 。 

人 5 每 次 抓 取 网 页 之 后 分 析 其 中 的 URL, 将 经 过 过 滤 的 合法 链接 写 入 运行 队列 ,等 待 提取 。 

人 6 重复 步骤 03、 步 又 04 和 步骤 05。 
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Python 的 网 络 爬 取 方式 有 很 多 种 ， 下 面 介绍 常用 的 几 种 网 络 爬 取 方 式 。 


18.3.1 基本 方法 


Python 中 基本 的 网 络 怜 取 几 行 代码 就 可 以 实现 ， 只 需 使 用 urllib 模块 中 的 request 即 可 。 我 们 
在 第 15 章 网 络 编程 中 已 经 有 相关 实现 ， 代 码 如 下 〈exp_requestpy) : 
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#! /usr/bin/python3 
# -*- coding:UTF-8 一 * 一 


from urllib import request 


response = request.urlopen("https://movie.douban.com/") 
content = response.read() .decode('utf-8') 
print (content) 


结果 可 以 输出 许多 带 HTML 样式 的 文本 ， 大 部 分 都 是 无 用 的 信息 。 这 种 方式 虽然 非常 简单 ， 
但 抓 取 到 的 信息 没有 经 过 加 工 处 理 ， 所 以 没有 多 大 用 处 。 


18.3.2 ”使 用 代理 服务 器 


为 什么 要 使 用 代理 服务 器 ? 

当前 很 多 网 站 都 有 反 息 虫 机制 , 一 旦 发 现 某 个 IP 在 一 定时 间 内 请 求 次 数 过 多 或 请 求 频率 太 高 ， 
就 可 能 将 这 个 IP 标记 为 恶意 IP， 从 而 限制 这 个 IP 的 访问 ,或 者 将 这 个 IP 加 入 黑 名 单 ， 使 之 不 能 
继续 访问 该 网 站 。 

这 时 我 们 需要 使 用 代理 服务 器 ， 通 过 使 用 不 同 的 代理 服务 器 继续 抓 取 需 要 的 信息 。 示 例 代 码 
如 下 (proxy_request.py) : 


#! /usr/bin/python3 
#4 -*- coding:UTF-8 一 * 一 


from urllib import request 


Proxy_support = request.ProxyHandler ({'http':'http://xx.xx.xx.xx:xx'}) 
opener = request.build opener(proxy support, request.HTTPHandler) 
request.install opener (opener) 


content = request.urlopen('https://movie.douban.com/') .read() .decode ('utf-8') 
print (content) 


和 基本 方法 一 样 ， 这 样 仆 取 的 信息 没有 经 过 处 理 ， 得 到 的 结果 也 没有 多 大 用 处 ， 需 要 进一步 
加 工 后 才能 体现 价值 。 


18.3.3 ”Cookie 处 理 


对 于 安全 级 别 稍微 高 一 点 的 网 站 , 使 用 前 两 个 方法 都 无 法 仆 取 数据 。 这 些 网 站 需要 在 发 送 URL 
请 求 时 提供 cookie 信息 ， 否 则 无 法 请 求 成 功 。 示 例 代码 如 下 (cookie_request.py): 


#! /usr/bin/python3 
# -*- coding:UTF-8 -*— 





from urllib import request 
from http import cookiejar 


cookie support = request.HTTPCookieProcessor (cookiejar.CookieJar ()) 
opener = request.build opener(cookie support, request.HTTPHandler) 
request .install opener (opener) 


content = request.urlopen('https://movie.douban.com/') .read() .decode ('utf-8') 
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Print (content) 


当然 ， 这 也 是 一 种 简单 的 方式 ， 还 可 以 扩展 为 更 复杂 的 模式 。 


18.3.4 ”伪装 成 浏览 


当前 很 多 网 站 都 有 反 仆 虫 机 制 ， 对 于 扑 虫 请 求 会 一 律 拒绝 。 

程序 怎样 区 分 一 个 请 求 是 正常 请 求 还 是 疏 虫 程序 发 出 的 请 求 呢 ? 

程序 通过 判断 发 送 请 求 中 是 否 有 浏览 器 信息 判断 一 个 请 求 是 否 为 正常 请 求 。 当 访问 有 反 息 虫 
机 制 的 网 站 时 ， 我 们 在 请 求 中 设置 浏览 器 信息 〈 伪 装 成 浏览 器 ) ， 通 过 修改 HTTP 包 中 的 header 
实现 。 示 例 代码 片段 如 下 : 


postdata = parse.urlencode({}) 
headers = { 
'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 
Firefox/3.5.6' 
req = request.Request( 
url = 'https://www.zhihu.com/', 
data = postdata, 
headers = headers 
) 


通过 在 headers 中 设置 浏览 器 信息 ， 并 将 headers 放 入 request 请 求 中 ， 就 可 以 伪装 成 浏览 器 。 


18.3.5 登录 


对 于 当前 大 部 分 网 站 来 说 ， 登 录 是 必 不 可 少 的 。 
我 们 平常 登录 都 是 在 浏览 器 上 进行 的 ， 其 实 是 通过 浏览 器 向 对 应 服务 器 发 送 登 录 请 求 ， 服 务 
器 验证 通过 后 再 向 浏览 器 发 送 登 录 成 功 信息 ， 并 将 页 面 转向 登录 成 功 页 面 ， 展 现 相关 内 容 。 
使 用 扑 虫 程序 登录 时 ， 其 实 就 是 模仿 浏览 器 发 送 登 录 请 求 ， 将 登录 需要 的 用 户 名 和 密码 放 到 
请 求 数据 中 。 请 求 数据 大 致 形式 如 下 : 
postdata = parse.urlencode({ 
"username' :'XXXXX', 
"Password' ;'XXXXX', 
'continueURI':'http://www.verycd.com/', 
'fk':'fkasdfasdf', 
'login submit':' 登 录 '， 
3 


构建 好 请 求 数据 后 ， 再 将 构建 数据 放 入 请 求 中 ， 代 码 片段 如 下 : 


req = request.Request ( 
url = 'https://www.zhihu.com/', 
data = postdata 

) 

content = request.urlopen (req) .read() 
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Print (content) 
通过 这 种 方式 可 以 模拟 浏览 器 登录 相关 网 站 。 当 然 ， 还 有 不 少 网 站 需要 验证 码 ， 这 时 需要 编 
写 获取 验证 码 的 程序 。 这 方面 本 书 不 做 讨论 ， 有 兴趣 的 读者 可 以 自己 查阅 相关 资料 。 


18.4 爬虫 示例 一 一 抓 取 豆 次 电影 Top250 影评 数据 





前 面 我 们 讲解 了 扑 虫 的 一 些 概 念 和 技巧 ， 本 节 通 过 一 个 完整 的 示例 
影评 数据 介绍 仆 虫 的 使 用 。 


抓 取 豆 瓣 电 影 Top250 


18.4.1 确定 URL 格式 


我 们 先 来 观察 豆瓣 电影 Top250 任意 一 页 URL 地 址 的 格式 。 先 观察 第 一 页 ， 可 以 看 到 URL 地 
址 为 : https://movie.douban.com/top250?start=25&filter=。 这 一 页 展示 了 25 条 豆 斩 影评 数据 ,我 们 分 
析 一 下 这 个 地 址 。 
https:// 代表 资源 传输 使 用 HTTPS 协议 。 
movie.douban.com 是 豆 辩 的 二 级 域名 ， 指 向 豆 辩 的 服务 器 。 

/top250 是 服务 器 的 某 个 资源 ， 即 豆 关 电影 Top250 的 地 址 定位 符 。 
start=25&filter= 是 该 URL 的 两 个 参数 ， 分 别 代表 从 多 少 条 记录 开始 展示 和 过 滤 条 件 。 


在 实际 开发 中 ， 为 了 更 好 地 与 开发 应 用 结合 ， 我 们 一 般 将 URL 分 为 两 部 分 ， 一 部 分 为 基础 部 
小 ， 是 不 可 变 部 分 ， 另 一 部 分 为 参数 部 分 ， 是 可 变 部 分 。 

例如 ， 上 面 的 URL 可 以 划分 为 基础 部 分 : https://movie.douban.com/top250 ， 参 数 部 
分 : ?start=25&filter=。 


bd 
bd 
bd 
二 


18.4.2 页面 抓 取 


熟悉 了 URL 的 格式 ， 下 面 用 urllib 库 试 着 抓 取 页 面 内 容 。 

我 们 以 面向 对 象 的 编码 方式 编写 这 个 页 面 抓 取 程序 。 定 义 一 个 类 名 MovieTop， 在 类 中 定义 一 
个 初始 化 方法 和 一 个 获取 页 面 的 方法 。 

我 们 把 一 些 基本 信息 的 参数 初始 化 放 在 类 的 初始 化 中 ， 即 init 方法。 另外 ， 获 取 页 面 的 方法 ， 
我 们 需要 知道 从 第 几 条 记录 开始 查找 、 每 次 查找 多 少 条 记录 。 在 这 个 方法 中 需要 一 个 循环 ， 通 过 循 
环 抓 取 需要 的 记录 。 

初步 构建 基础 代码 如 下 (exp_movie top.py) : 


from urllib import request 
class MovieTop (object) : 
def _init (self): 
self.start = 0 
self.param= '&filter=" 
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self.headers = {'User-Agent': "Mozilla/5.0 (Windows NT 6.1; WOW64) '} 


def get page (self) : 
page content = [] 
try: 
while self.start <= 225: 

url = "https://movie.douban.com/top250?start=' + str(self.start) 
req = request.Request (url, headers = self.headers) 
response = request.urlopen (req) 
Ppage = response.read() .decode ('utf-8') 
page num = (self.start + 25)//25 
print (f' 正 在 抓 取 第 { str (page_num) } 页 数据 ...， ) 
self.start += 25 


Page_ content .append (page) 
return page_content 
except request.URLError as e: 
if hasattr(e, 'reason'): 


print (f' 抓 取 失 败 ， 失 败 原因 ; {e.reason}"') 


def main(self): 
print ( "开始 从 豆瓣 电影 抓 取 数据 . . . . .. . - 由 
self.get page() 
print (' 数 据 抓 取 完毕 . . .) 
在 这 个 初步 构建 的 程序 中 ， 我 们 只 指定 了 一 些 数据 假 取 参数 ， 对 于 息 取 的 数据 并 没有 做 任何 
处 理 ， 也 没有 保存 仆 取 数据 。 该 程序 可 以 校 验 该 息 虫 程序 是 否 可 以 正确 运行 。 至 于 运行 结果 如 何 处 
理 ， 后 续 章节 会 继续 深入 介绍 。 


18.4.3 ”提取 相关 信息 


当前 我 们 抓 取 的 数据 阅读 起 来 颇 为 不 便 ， 扑 取 的 数据 中 有 许多 HTML 格式 的 文本 。 我 们 是 否 
可 以 过 滤 这 些 HTML 格式 的 文本 呢 ? 

Python 中 的 re 模块 为 我 们 提供 了 一 个 compile 函数 ， 该 函数 可 以 帮助 我 们 把 正则 表达 式 语 法 
转化 成 正则 表达 式 对 象 。 

先 看 一 个 简单 示例 : 

html_text = '<p class="name"> 导 演 : 冯小刚 </p>' 


reObj = re.compile(u'<p.*?class="name"> 导 演 : (.*?)</p>.*?') 
Print (reObj .findall (html_text) ) 


执行 这 段 程序 ， 输 出 结果 如 下 : 

[ "冯小刚 '] 

由 执行 结果 得 知 ， 本 应 该 在 HTML 标签 中 的 文本 ， 经 过 compile 函数 处 理 后 ， 最 后 得 到 了 一 
个 列表 ,里 面包 含 一 个 名 字 ， 而 将 其 他 干扰 信息 过 滤 了 。 这 就 是 我 们 使 用 re 模块 中 的 compile 函数 
结合 正则 表达 式 得 到 的 。 

在 compile 函数 处 理 表达 式 中 ， 有 3 个 字符 需要 说 明 ， 这 3 个 字符 是 re 正则 表达 式 中 的 语法 
字符 。 
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“”， 代 指 任何 字符 。 
“#?， 代 指 0 个 或 多 个 字符 ( 贪 禁 匹 配 )。 
“2”， 代 指 0 个 或 多 个 字符 ( 贪 禁 匹配 )。 


更 多 相关 字符 可 以 查看 re 模块 中 正则 表达 式 的 语法 字符 。 
下 面 看 一 个 更 复杂 的 示例 : 
html text = '<p class="info"> 导 演 : 陈凯歌 Kaige Chengnbsp; gnbsp; gnbsp;' \ 
' 主 演 : 张国荣 Leslie Cheung / 张 丰 孝 Fengyi Zha...<br>' \ 
"1993&nbsp;/snbsp; 中 国 大 陆 香港 snbsp; / snbsp; 剧 情 爱情 </p>' 
# s='<span>740137 人 评价 </span>' 
reObjl = re.compile (u'<p.*?class="info"> 导 演 : (.*?)' 
+ u'&ENnbsp; Enbsp; Enbsp; .*?<br>" 
+ u'(.*?)é&nbsp;/&nbsp; (.*?)" 
+ U'&nbsp;/&nbsp; (.*?)</p>.*?') 
print (reObj1.findall (html text)) 
旦 序 执行 结果 如 下 : 
[(' 陈 凯歌 Kaige chen'，'1993',，' 中 国 大 陆 香港 '，' 剧 情 爱情 ') ] 


从 执行 结果 看 到 ， 通 过 这 种 方式 可 以 从 一 长 串 杂 乱 的 HTML 文本 中 提取 一 些 精炼 的 信息 。 
在 MovieTop 类 中 ， 我 们 可 以 用 面向 对 象 的 思路 提取 一 个 专门 做 HTML 文本 解析 的 方法 ， 从 
而 从 文本 中 解析 出 我 们 所 关注 的 内 容 。 在 该 类 中 我 们 定义 一 个 方法 ， 形 式 如 下 : 


def get movie info(self): 
Pattern = re.compile(u'<div.*?class="item">.*?....) 


18.4.4” 写 入 文件 


写 入 文件 的 过 程 很 简单 ， 主 要 代码 如 下 : 
file top = open(self.file path, 'w', encoding='utf-8') 


file top.write (obj) 

文件 写 入 的 细节 我 们 在 第 12 章 已 经 详细 介绍 过 ， 读 者 若 不 明白 可 以 再 次 阅读 这 一 章 内容 。 在 
该 示例 中 ， 我 们 编写 一 个 方法 专门 用 于 文件 的 写 入 操作 ， 使 得 程序 面向 对 象 化 。 在 MovieTop 类 中 
定义 一 个 方法 ; 

def write text (self): 


Print (' 开 始 向 文件 写 入 数据 . ........ 
file top = open(self.file path, 'w', encoding='utf-8') 


18.4.5 ”完善 代码 


经 过 前 面 的 一 番 准 备 ， 下 面 完善 这 个 息 虫 程序 ， 将 仆 取 到 的 相关 信息 保存 到 D 盘 的 
movie_spider.txt 文件 中 。 完 整 代码 如 下 (movie top.py) : 
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执行 这 段 程序 ， 会 在 D 盘 中 生成 movie_spider.txt 文件 ， 并 在 该 文件 中 写 入 从 网 站 上 疏 取 到 的 
相关 信息 ， 里 面 保存 的 字符 格式 就 是 我 们 在 程序 中 定义 的 格式 。 大 致 形式 如 下 : 
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制作 国家 /地 区 : 美国 
电影 类 别 : 犯罪 剧情 
电影 评分 : 9.6 
参评 人 数 : 740538 


简短 影评 : 希望 让 人 自由 。 


18.5 项 目 小 结 


本 童 通过 一 个 候 虫 程序 将 前 面 所 学 的 知识 用 于 实战 。 所 举 示 例 为 方便 理解 ， 没 有 运用 伪装 浏 
览 咒 和 登录 的 知识 。 学 有 余力 的 读者 可 以 查看 一 些 候 虫 框架 ， 如 比较 通用 的 Scrapy 框架 。 


代码 实例 





扫 码 看 视频 





第 19 章 
自然 语言 分 词 与 词 频 统计 


本 章 将 介绍 一 个 简单 的 自然 语言 处 理 示 例 。 通 过 该 示例 ， 结 合 前 面 各 章节 的 知识 ， 进 一 步 提 
高 对 前 面 各 章节 知识 点 的 巩固 。 

本 章 会 先 介 绍 几 个 新 的 库 ， 如 SQLAlchemy、pyecharts、jieba 分 词 库 、BeautifulSoup 等 。 

本 章 会 先 通过 一 个 候 虫 程序 息 取 相关 内 容 ， 再 将 对 应 内 容 分 词 后 添加 到 数据 库 ， 最 后 从 数据 
库 中 拿 到 数据 做 词 频 统计 并 生成 统计 图 。 


19.1 ”概念 介绍 


在 开始 分 词 与 词 频 统计 项 目 之 前 ， 有 几 个 概念 我 们 先 了 解 一 下 。 
19.1.1 SQLAIchemy 简介 


SQLAlchemy 是 Python 编程 语言 下 的 一 款 开源 软件 ， 提 供 了 SQL 工具 包 及 对 象 关 系 映射 
(Object Relational Mapping，ORM) 工具 。 

SQLAlchemy 采用 简单 的 Python 语言 ， 为 高 效 和 高 性 能 的 数据 库 访问 设计 实现 了 完整 的 企业 
级 持久 模型 。SQLAlchemy 的 理念 是 ，SQL 数据 库 的 量 级 和 性 能 重要 于 对 象 集合 ， 而 对 象 集合 的 抽 
象 又 重要 于 表 和 行 。 因 此 ，SQLAlchmey 采用 类 似 于 Java 中 Hibemate 的 数据 映射 模型 ， 而 不 是 其 
他 ORM 框架 采用 的 Active Record 模型 。 

SQLAlchemy 首次 发 行 于 2006 年 2 月 ， 并 迅速 地 成 为 Python 社区 中 广泛 使 用 的 ORM 工具 之 
一 ， 不 亚 于 Django 的 ORM 框架 。 

关于 SQLAIchemy 的 更 多 信息 可 以 查看 官方 网 站 : 

http://www.pythondoc.com/flask-sqlalchemy/api.html#flask.ext.sqlalchemy.SQLAIchemy 
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19.1.2 ”pyecharts 简介 


pyecharts 是 一 个 用 于 生成 Echarts 图 表 的 类 库 。Echarts 是 百度 开源 的 一 个 数据 可 视 化 JS 
库 。 用 Echarts 生成 的 图 可 视 化 效果 非常 棒 , pyecharts 是 为 了 与 Python 进行 对 接 , 方便 在 Python 
中 直接 使 用 数据 生成 图 。 

关于 pyecharts 的 更 多 信息 可 以 查看 官方 网 站 : 

http://pyecharts.org 





19.1.3 jieba 分 词 库 简介 


jieba〈 结 巴 ) 是 一 个 强大 的 分 词 库 ， 完 美 支持 中 文 分 词 。 
jieba 支持 以 下 三 种 分 词 模式 。 
(1) 精确 模式 : 将 句子 以 最 精确 的 方式 切 开 ， 适 合 文本 分 析 。 
(2) 全 模式 : 把 句子 中 所 有 可 以 成 词 的 词语 都 扫描 出 来 ， 速 度 非常 快 ， 但 是 不 能 解决 词语 的 
歧义 问题 。 
(3) 搜索 引擎 模式 : 在 精确 模式 的 基础 上 ， 对 长 词 再 次 切 分 ， 提 高 召回 率 ， 适 合用 于 搜索 引 
擎 分 词 。 
jieba 还 支持 繁体 分 词 和 自 定 义 词典 。 
19.1.4 ”BeautifulSoup 库 简 介 
BeautifulSoup 是 Python 的 一 个 库 ， 是 用 Python 写 的 一 个 HTML/XML 解析 器 ， 最 主要 的 功能 
是 从 网 页 怜 取 我 们 需要 的 数据 。 
BeautifulSoup 可 以 很 好 地 处 理 不 规范 标记 并 生成 剖析 树 (parse tree) 。BeautifulSoup 提供 简 
单 又 常用 的 导航 (Cnavigating) 、 搜 索 以 及 修改 前 析 树 的 操作 。 


BeautifulSoup 将 HTML 解析 为 对 象 进行 处 理 ， 全 部 页 面 转变 为 字典 或 者 数组 ， 相 对 于 正则 表 
达 式 的 方式 ， 可 以 大 大 简化 处 理 过 程 。 


19.2” 库 的 安装 与 使 用 


19.1 节 我 们 大 概 介绍 了 几 个 新 的 库 ， 本 节 将 讲述 如 何 安装 这 些 新 库 ， 以 及 通过 简单 的 示例 来 
介绍 这 些 新 库 的 使 用 方式 。 


19.2.1 SQLAIchemy 的 安装 与 使 用 


在 Python 中 ，SQLAIchemy 的 安装 方式 如 下 : 
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pip install sqlalchemy 


SQLAIchemy 的 使 用 示例 如 下 (sqlalchemy_exp.py) : 


from sqlalchemy import create engine, Column, String, Integer 
from sqlalchemy.orm import sessionmaker 
from sqlalchemy.ext.declarative import declarative base 


建立 数据 库 连接 ， 连 接 方式 为 : 

mysql+pymysql :// 数 据 库 用 户 名 :密码 8 数据库 地 址 /数据 库 名 ?charset=utf8 

pool_size 为 数据 库 连 接 池 数 

5 

engine = create engine('mysqlt+pymysql://root:root@localhost/test?charset=utf8', 
echo=False, pool_size = 5) 

# 建立 会 话 

DBSession = sessionmaker (bind=engine) 

session = DBSession() 

# 模型 声明 


Base = declarative base() 


class NLPAnalysis (Base): 


定义 一 个 类 对 象 ， 一 般 称 为 模型 

_ tablename ”属性 对 应 数据 库 名 

其 余 字段 属性 对 应 数据 库 表 中 各 字段 的 名 称 和 属性 

mm 

__tablename_ _ = 'nlp analysis' 

id = Column(Integer, primary key=True) 

question title = Column(String (200) ，default=None，doc=' 问 题 标题 ') 
question answer = Column (String(500)，default=None，doc=' 问 题 答 案 ') 
fen_ci_result = Column (String(1000) ，default=None，doc=' 标 题 分 词 结果 ') 


# drop all 根据 模型 用 来 删除 表 ， 该 语句 慎 用 ， 此 处 为 示例 而 用 ， 一 般 不 建议 使 用 

Base.metadata.drop _ all (engine) 

# 根据 模型 用 来 创建 表 

Base.metadata.create all (engine) 

配置 好 对 应 的 数据 库 连 接 方式 后 ， 执 行 代码 ， 可 以 在 对 应 数据 库 中 看 到 所 创建 的 表 ， 通 过 
Navicat (MySQL 客户 端 工具 ) 查看 ， 如 图 19-1 所 示 。 
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19-1 创建 表 


19.2.2 ”pyecharts 的 安装 与 使 用 


在 Python 中 ，pyecharts 的 安装 方式 如 下 : 
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pip install pyecharts 


pyecharts 的 使 用 示例 如 下 (pyecharts_exp.py)》: 


import os 
from pyecharts import Bar 


# 水 平 模 条 

bar = Bar("Python 3.7 从 零 开始 学 "，" 按 城市 统计 ") 

bar.add ("阅读 人 数 分 布 "，[" 北 京 "，" 上 海 "， "广州 "，" 深 圳 "， "杭州 "，" 成 都 "]， 
[500, 450, 360, 450, 355, 380]) 

# 打印 设置 参数 信息 

bar.show config() 

bar.render (path=os.getcwd() + '/static/' + "pyecharts_ exp.html") 


在 当前 目录 下 创建 一 个 名 为 static 的 文件 夹 ， 执 行 该 示例 代码 ， 会 在 static 目录 下 生成 一 个 名 
为 pyecharts_exp.html 的 HTML 文件 ， 直 接 用 Chrome 或 其 他 浏览 器 打开 这 个 HTML 文件 ， 能 看 到 
一 张 如 图 19-2 所 示 的 图 。 


Python 3.7 从 零 开 始 学 本 em 


2 二 am EE mh sy 


图 19-2 pyecharts 水 平 横 条 图 











19.2.3 jieba 分 词 库 的 安装 与 使 用 


在 Python 中 ，jieba 的 安装 方式 如 下 : 
pip install jieba 

jieba 的 使 用 示例 如 下 (jieba_exp.py) : 
import jieba 


cut 方法 有 两 个 参数 
1) 第 一 个 参数 是 我 们 想 分 词 的 字符 串 
2) 第 二 个 参数 cut_al1 用 来 控制 是 否 采 用 全 模式 


# 全 模式 

word_list = jieba.cut("《PYthon 3.7 从 零 开始 学 》 是 一 本 得 好 好 看 看 的 好 书 ! ", cut_all=True) 
print ("全 模式 : ","|".join(word list)) 

# 精 确 模 式 ， 默 认 就 是 精确 模式 
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word list = jieba.cut("《Python 3.7 从 零 开始 学 》 是 一 本 得 好 好 看 看 的 好 书 ! ", cut all=False) 
print ("精确 模式 : ","|".join (word list)) 

# 搜 索引 擎 模式 

word list = jieba.cut for search(" 《Python 3.7 从 零 开始 学 》 是 一 本 得 好 好 看 看 的 好 书 ! ") 
print (" 搜 索引 擎 : ","1".join (word_list)) 


执行 示例 代码 ， 得 到 如 下 结果 : 


全 模式 |Python131711 从 零 开始 | 开始 | 学 11 1 是 | 一 本 | 得 | 好 好 | 好 好 看 | 好 看 | 看 看 1 的 | 好 书 | | 
精确 模式 : 《1Python| 13.7| | 从 零 开始 | 学 1》| 是 | 一 本 | 得 | 好 好 | 看 看 | 的 | 好 书 | ! 
搜索 引擎 : 《1Python| 13.71 | 开始 | 从 零 开 始 | 学 |》| 是 | 一 本 | 得 | 好 好 | 看 看 | 的 | 好 书 1! 


19.2.4 ”BeautifulSoup 的 安装 与 使 用 


在 Python 中 ，BeautifulSoup 的 安装 方式 如 下 : 
pip install beautifulsoup4 


BeautifulSoup 的 使 用 示例 如 下 (beautiful soup_exp.py) : 


import requests 
from bs4 import BeautifulSoup 


url = "http://www.baidu.com' 

# 创建 实例 

resp = requests.get (url) 

# 创建 对 象 

bs = BeautifulSoup (resp.content) 
# 提取 Tag 

title cont = bs.title 

print (title cont) 

print (type (title_cont)) 


执行 该 示例 代码 ， 得 到 如 下 结果 : 


<title> 百 度 一 下 ， 你 就 知道 </title> 
<class 'bs4.element.Tag'> 


19.3 分词 与 词 频 统计 实战 


19.2 节 我 们 大 概 介绍 了 几 个 新 的 库 ， 本 节 将 讲述 如 何 安装 这 些 新 库 ， 以 及 通过 简单 的 示例 来 


介绍 这 些 新 库 的 使 用 方式 。 


字 ( 


经 过 前 面 两 节 知 识 点 的 讲解 ， 现 在 我 们 结合 这 些 知 识 点 实现 以 下 功能 : 


(1) 从 一 个 指定 网 站 疏 取 对 应 数据 ， 本 章 以 咎 取 百 度 知道 的 内 容 为 例 ， 根 据 输 入 的 指定 关键 
关键 字 不 能 为 空 ) ， 怜 取 用 该 关键 字 搜索 到 的 问题 标题 和 问题 回答 ， 并 对 问题 标题 以 搜索 引擎 





模式 进行 分 词 。 


(2) 将 (1) 中 疏 取 的 问题 标题 、 问 题 回 答 和 分 词 结果 保存 到 MySQL 数据 库 中 。 
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(3) 数据 仆 取 结束 并 保存 到 数据 库 后 ， 从 MySQL 数据 库 中 取出 保存 的 记录 ， 根 据 保存 的 分 词 结 
果 进 行 统计 ， 经 过 给 定 的 关键 词 库 进行 过 滤 后 ， 统 计 各 个 关键 词 出 现 的 次 数 ， 并 以 图 表 的 形式 展现 出 来 。 
根据 以 上 要 求 ， 下 面 介绍 具体 的 实现 方式 。 


19.3.1 整体 结构 设计 


根据 要 求 设 计 整 体 结构 ， 如 图 19-3 所 示 。 


Y Bchapter19 





Y Bnlp_analysis 
Y Bdatabase 
器 models.py 
Bi rule 
key_words.py 
server 
get_input_info.py 
多 info_search.py 
项 word_count.py 
static 





员 run.py 


图 19-3 ”整体 结构 图 


在 chapter19 文件 目录 下 创建 一 个 名 为 nlp_analysis 的 文件 夹 ，nlp_analysis 文件 夹 下 各 个 文件 
或 文件 夹 的 功能 如 下 : 


® database 文件 天 用 于 存放 与 数据 库 直 接 关联 的 文件 , 文件 夹 下 的 models.py 文件 用 于 编写 模型 
对 象 ， 即 数据 库 表 对 应 的 对 象 ， 以 及 表 的 增删 改 查 方法 的 编写 。 

rule 文件 夹 用 于 存放 定义 的 规则 ， 文 件 夹 下 的 key_words.py 文件 用 于 编写 关键 词 库 的 集合 。 

@ server 文件 夹 用 于 编写 远 辑 业务 。get_input_info.py 文件 用 于 读 取 从 控制 台 输入 的 参数 值 。 
info_search.py 文件 用 于 编写 数据 扑 取 代码 ， 以 及 将 疏 取 数据 处 理 后 保存 到 数据 库 的 逻辑 。 
word_count.py 文件 用 于 编写 词 频 统计 和 生成 图 表 逻 辑 。 

estatic 文 件 夹 用 于 存放 静态 HTML 文件 。 

@ run.py 文件 为 项 目 入 口 。 


接 下 来 大 概 介绍 各 个 文件 中 的 逻辑 实现 的 思路 ， 完 整 代码 将 在 19.4 节 展 示 ， 下 面 对 逻 辑 进 行 
讲解 ， 并 以 代码 辅助 。 


19.3.2 ”数据 结构 设计 


根据 前 面 的 整体 结构 图 , 数据 结构 设计 代码 编写 在 models.py 文件 中 , 定义 一 个 叫 NLPAnalysis 
的 类 ， 类 中 定义 _ tablename_ 的 值 为 nlp_analysis， 即 表 名 为 nlp_analysis。 再 定义 4 个 字段 ， 命 名 
分 别 为 这 (主键 ，Integer 类 型 ) 、question title (问题 标 题 ，String， 长 度 为 200) 、question_answer 
(问题 答案 ，String， 长 度 为 500) 和 fen_ci_result (标题 分 词 结果 ，String， 长 度 为 1000) ， 代 码 
实现 如 下 (models.py) : 
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from sqlalchemy import create engine, Column, String, Integer 
from sqlalchemy.orm import sessionmaker 
from sqlalchemy.ext.declarative import declarative base 


# 建立 链接 

engine = create engine('mysql+pymysql://root:root@localhost/test?charset=utf8', 
echo=False, pool size = 5) 

# 建立 会 话 

DBSession = sessionmaker (bind=engine) 

session = DBSession() 


# 模型 声明 


Base = declarative base() 


class NLPAnalysis (Base): 
_tablename = 'nlp analysis' 
id = Column(Integer, primary key=True) 
question title = Column(String (200)，default=None，doc=' 问 题 标题 ') 
question answer = Column (String(500), default=None，doc=' 问 题 答 案 ') 
fen_ci_result = Column (String (1000)，default=None，doc=' 标 题 分 词 结果 ') 


# drop all 根据 模型 用 来 删除 表 ， 该 语句 慎 用 ， 此 处 为 示例 而 用 ， 一 般 不 建议 使 用 
Base.metadata.drop all (engine) 
# 根据 模型 用 来 创建 表 


Base.metadata.create all (engine) 


19.3.3 ”数据 的 仆 取 与 保存 


根据 从 get_input_info.py 文件 中 获取 的 输入 参数 ， 去 指定 网 站 根据 指定 关键 字 做 数据 爬 取 ， 数 
据 疏 取 的 关键 点 如 下 。 

网 页 分 析 ， 分 析 需 要 用 GET 请 求 还 是 POST 请 求 ， 如 https://zhidao.baidu.com/， 分 析 要 使 用 的 
是 GET 请 求 (此 处 不 做 具体 爬虫 方法 的 介绍 ， 可 自行 查询 资料 解决 ， 如 在 浏览 器 搜索 : 查看 HTTP 
请 求 详情 ， 就 会 有 很 多 答案 告诉 你 该 怎么 查看 ) ， 接 着 分 析 请 求 头 的 构造 形式 ， 再 分 析 进 行 关键 字 
搜索 时 ， 参 数 的 构造 形式 是 怎样 的 ， 关 键 字 怎么 放 入 URL 请 求 中 ， 定 位 到 某 一 页 的 请 求 参数 是 怎 
样 的 , 由 此 构造 一 个 通用 的 字符 串 参 数 ,最 后 分 析 问 题 标题 和 问题 答案 所 对 应 的 是 哪些 标签 的 内 容 。 

这 部 分 逻辑 代码 实现 如 下 ， 定 义 get_data_from_web 方法 (info_search.py) : 


# 数据 收集 
def get data from web(input key word, begin page=None, end page=None): 
for i in range(begin page, end page): 
if begin page is not None and begin page > 0 and i < begin page - 1: 
continue 


search url = (BAIDU PRE + BAIDU SEARCH).format (input key word, i * 10) 
print (f' 当 前 仆 取 第 ({i}) 页 ， 搜索 url 为:{search url}"') 
try: 
r= requests.get(search url, headers=headers) 
status code = r.status code 
if status code != 200: 
return 
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req = BeautifulSoup(r.content.decode('gbk', ‘'ignore'), "html151ib") 
result item val = req.find alll('div', re.compile('list-inner')) [0] 
result item list = result item val.find alll('div', re.compile('list'))[0] 
a_tag list = result item list.find all('a', re.compile('ti')) 
for a tag item in a tag list: 
if a tag item is None or a tag item == '': 





continue 


href val = str(a tag item.get('href')) 


if href val is None or href val 一 "'': 
continue 
# 问题 标题 


question title = a tag item.text 
# 最 多 取 200 个 字符 
if len (question title) > 200: 
question title = question title[ : 200] 
# 问题 答案 
question answer = get_detail_info(href_val) 
if len (question_answer) > 500: 
question_answer = question_answer[ : 500] 
# 问题 标题 分 词 结果 
fen ci result = jie ba fen cil(question title) 
except Exception as ex: 
print (f' 让 取 第 ({1i)) 页 失败 ， 失 败 原因 {ex} ') 
print (f' 第 ({1}) 页 信息 疏 取 结束 。" ) 


其 中 ，get_detail info 方法 实现 如 下 : 


detail url = detail suffix 
r= requests.get (detail url, headers=headers) 
resp = BeautifulSoup(r.content.decode('gbk', 'ignore'), "html51ib') 
detail text list = resp.find all('div', re.compile('best-text')) 
if detail text list is None or detail text list. len () <= 0: 
return '' 


question answer = str(detail text list[0].text).strip() 


return question answer 


jie_ba_fen_ci 实现 如 下 : 


# jie ba 分词 

def jie ba fen ci(input val) : 
# 搜索 引擎 模式 
result list = jieba.cut for search(input val) 
result val = ','.join(result list) 


return result val 


问题 标题 、 问 题 答 案 和 分 词 结果 取得 后 ， 接 下 来 需要 把 这 些 获取 的 信息 保存 到 数据 库 中 ， 保 
存 数据 时 ， 将 需要 保存 的 数据 以 一 个 对 象 的 形式 传递 给 模型 ， 在 get_data_from_web 方法 中 需要 加 
入 以 下 代码 : 
row info dict = dict() 


row info dict['question title'] = question title 
row info dict['question answer'] = question answer 
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row info dict['fen ci result'] = fen ci result 
models.insert_record(row info dict, 'nlp analysis') 


同时 需要 在 models.py 中 添加 以 下 方法 : 


def insert record(dict value, table name=None): 


插入 记录 方法 
:param dict_value: 字段 值 字典 
:Param table name: 表 名 
:return: None 
mm 
if table name == 'nlp_analysis' and dict value: 
data = NLPAnalysis (question title=dict value['question title'], 
question answer=dict value['question answer'], 
fen ci result=dict value['fen ci result']) 
session.add(data) 
session.commit() 
session.close () 


至 此 就 实现 了 数据 的 假 取 和 数据 的 持久 化 ， 完 整 代码 可 在 19.4 节 中 查看 。 


19.3.4 制定 关键 词 库 


疏 取 数据 后 ， 需 要 分 析 哪些 关键 词 对 于 词 频 分 析 是 有 用 的 ， 哪 些 是 无 用 的 ， 有 用 的 就 保留 ， 
无 用 的 就 过 滤 掉 。 下 面 是 一 个 简单 的 关键 词 搜集 示例 ， 这 些 可 以 视 为 是 有 用 的 关键 词 ， 代 码 如 下 
(key_words.py) : 


useful word list = ['Python', 'python','3.5'，'3.7'，' 升 级 '， 
' 入 门 '，' 基 础 '，' 精 通 ' ，' 实 现 ' ，' 为 什么 '， 
' 是 什么 '。，' 关 于 ' ，' 意思 ' ，' 问题 '，' 教 程 '，' 试 学 '] 


19.3.5” 词 频 统计 与 图 表 生成 


有 了 数据 和 关键 词 比 对 规则 后 ， 接 下 来 要 做 的 是 从 数据 库 取出 数据 ， 根 据 过 滤 规 则 过 滤 后 ， 
统计 满足 规则 的 各 个 词 的 出 现 次 数 。 定 义 word_count 方法 ， 代 码 如 下 〈word_countpy) : 


def word_count () : 
word_ tuple list = query from mysql() 
for word tuple in word tuple list: 
if word tuple is None or len(word tuple) <= 0: 
continue 
word_ list = word tuple[0].split(',') 
for item val in word list: 
if item val is None or item val == '' or str(item val) .strip() == "': 


continue 


# 有 用 字符 匹配 
val_in list = item val in key words.useful word list 
if val in list is False: 


continue 
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count num = word dict.get (item val) 

if count_num is not None and count num >= 1: 
count num += 1 
word dict[item val] = count_ num 

else: 
word dict [item vall] 


query_from_mysql 的 实现 如 下 : 


def query from mysql(): 


2 


从 表 中 查询 结果 
:return: tuple 集 列表 


query sql = "SELECT fen ci result FROM nlp analysis" 
result list = models.query record(query sql) 
return result list 


在 models.py 文件 中 需要 添加 如 下 方法 : 


def query record(query sql): 


记录 查询 方法 
:param query_sql: 查询 语句 
:return: 查询 结果 


return session.execute (query_sql) 


统计 工作 完成 后 ， 最 后 需要 根据 统计 结果 绘制 图 表 ， 以 绘制 水 平 横 条 为 例 ， 实 现代 码 如 下 : 
# 水 平 模 条 


def draw bar horizontal(): 
word items = list(word dict.items()) 
word keys = [k for k, v in word items] 
word values = [Vv for k, v in word items] 
bar = Bar (' 水 平 图 表 ' ，' 关 键 字 使 用 情况 分 布 ') 
bar.add ("引用 次 数 '，word_keys, word values) 
# 可 以 选择 是 否 在 控制 台 打印 配置 信息 ， 打 开 注释 ， 执 行 时 在 控制 台 打印 配置 详情 信息 
# bar.show config() 
# html 文件 存放 路 径 
bar.render (path=file path pre + "bar horizontal.html") 


在 word_count 方法 的 最 后 需要 调用 该 方法 以 达到 统计 结束 后 就 绘制 统计 图 的 效果 。 完 整 代码 
实现 见 19.4 节 。 


19.4 ”分 词 与 词 频 统计 完整 代码 实现 与 结果 查看 


经 过 19.3 节 的 详细 讲解 ， 相 信 大 家 对 19.3 节 提出 的 需求 已 经 有 一 个 大 致 的 实现 思路 ， 现 在 本 
节 展 现 各 .py 文件 的 完整 实现 代码 。 
程序 入 口 实现 代码 如 下 (run.py) : 
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from chapter19.nlp analysis.server.get input info import get input data 
from chapterl9.nlp analysis.server.info search import get data from web 
from chapterl9.nlp analysis.server.word count import word count 





if _name ==" main ": 
# 取得 输入 参数 
input key word, begin page, end page = get input data() 
## 从 网 站 取得 数据 并 存储 到 数据 库 
get data from webl(input key word, begin page, end page) 
# 词 频 统计 并 生成 统计 图 


word_count .word_count () 


模型 实现 代码 如 下 (models.py) : 


from sqlalchemy import create engine, Column, String, Integer 
from sqlalchemy.orm import sessionmaker 
from sqlalchemy.ext.declarative import declarative base 


# 建立 链接 

engine = create engine('mysql+pymysql://root:root@localhost/test?charset=utf8', 
echo=False, pool size = 5) 

# 建立 会 话 

DBSession = sessionmaker (bind=engine) 

session = DBSession() 

# 模型 声明 


Base = declarative_ base() 


class NLPAnalysis (Base): 
tablename = 'nlp analysis' 
id = Column(Integer, primary key=True) 
question title = Column(String (200)，default=None，doc=' 问题 标题 ') 
question answer = Column (String(500) ，default=None，doc=' 问 题 答案 ') 
fen_ci_result = Column (String(1000) ，default=None，doc=' 标 题 分 词 结果 ' ) 


# drop all 根据 模型 用 来 删除 表 ， 该 语句 慎 用 ， 此 处 为 示例 而 用 ， 一 般 不 建议 使 用 
Base.metadata.drop all (engine) 
# 根据 模型 用 来 创建 表 


Base.metadata.create all (engine) 


def insert_record(dict value, table name=None): 
nn 
插入 记录 方法 
:param dict_value: 字段 值 字典 
:param table_name: 表 名 
:return: None 
mm 
if table name == 'nlp analysis' and dict value: 
data = NLPAnalysis (question title=dict value['question title'], 
question answer=dict value['question answer'], 
fen ci result=dict value['fen ci result']) 
session.add(data) 
session.commit () 
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取得 输入 参数 实现 代码 如 下 (get_input_info.py) : 
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从 网 站 取得 数据 并 存储 到 数据 库 的 实现 代码 如 下 (info_search.py) : 
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有 效 关键 词 实现 代码 如 下 (key_words.py): 


为 了 更 直观 地 查看 统计 图 效果 ， 本 例 中 生成 三 种 统计 图 : 水 平 直方 


现 如 下 (word_ countpy) : 
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draw pie() 
draw word cloud() 


# 水 平 模 条 
def draw bar _ horizontal(): 
word items = list(word dict.items()) 
word keys = [k for k, v in word items] 
word values = [V for k, v in word items] 
bar = Bar (' 水 平 图 表 ' ，' 关 键 字 使 用 情况 分 布 ') 
bar.add (' 引用 次 数 '，word_keys, word_values) 
## 可 以 选择 是 否 在 控制 台 打印 配置 信息 ， 打 开 注释 ， 执 行 时 在 控制 台 打印 配置 详情 信息 
# bar.show config() 
# html 文件 存放 路 径 
bar.render (path=file path pre + "bar horizontal.html") 


# 饼 图 
def draw pie(): 
word items = list(word dict.items()) 
word_ keys = [k for k, v in word items] 
word values = [v for k, v in word items] 
pie = Pie(" 饼 图 ") 
pie.add ("引用 次 数 "，word_keys, word values, is label show=True) 
# pie.show_ config() 
# html 文件 存放 路 径 
Pie.render (path=file path pre + "Pie.html") 


# 词 云图 
def draw_word_cloud() : 
word items = list(word dict.items()) 
word_keys = [k for k, v in word items] 
word values = [V for k, v in word items] 
word cloud = Wordcloud (width=1300, height=620) 
word cloud.add("", word keys, word values, word size range=[20, 100]) 
# word cloud.show config() 
# html 文件 存放 路 径 
word_cloud.render (path=file path pre + "word_cloud.html") 


if _name ==" main ": 


word_count () 


执行 run.py 文件 ， 从 控制 台 输 入 如 下 信息 : 


请 输入 关键 词 : Python 

请 输入 起 始 页 码 (页 码 必须 为 大 于 等 于 0 的 数字 ， 不 输入 直接 按 Enter， 默 认为 0): 0 

请 输入 结束 页 码 (结束 页 码 必须 大 于 等 于 起 始 页 码 ， 最 大 为 70， 不 输入 直接 按 Enter， 默 认为 最 大 值 。 超 过 最 大 值 ， 以 最 大 
值 算 ) : 2 


输入 信息 后 ， 控 制 台 打 印 出 如 下 信息 : 


起 始 页 码 为 : 0， 结束 页 码 为 2 
当前 仆 取 第 (0) 页 ， 搜 索 url 为 : 
https://zhidao.baidu.com/search?word=pythongie=gbk&site=-1&sites=0&date=0&pn=0 
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Building prefix dict from the default dictionary ... 

Loading model from cache C:\Users\lyz\AppData\Local\Temp\jieba.cache 

Loading model cost 1.237 seconds. 

Prefix dict has been built succesfully. 

第 (0) 页 信息 候 取 结束 。 

当前 仆 取 第 (1) 页 ， 搜 索 url 为 : 
https://zhidao.baidu.com/search?word=pythongie=gbk&site=-1l&sites=0&date=0gpn=10 
第 (1) 页 信息 仆 取 结束 。 


在 static 文件 夹 下 将 生成 如 图 19-4 所 示 的 静态 HTML 文件 。 





a static 


bar_horizontal.html 


pie.html 


word_cloud.html 





而 


19-4 静态 文件 


用 Chrom 浏览 器 打开 bar_horizontal.html 文件 ， 得 到 如 图 19-5 所 示 的 水 平 横 条 统计 图 。 
水 平 图 表 加 


18 


， 
Ee 生 思 





python 什么 Python 








19-5 ”水 平 横 条 统计 图 
用 Chrom 浏览 器 打开 pie.html 文件 ， 得 到 如 图 19-6 所 示 的 饼 图 统计 图 。 
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图 19-6” 饼 图 统计 图 
用 Chrom 浏览 器 打开 word_cloud.html 文件 ， 得 到 如 图 19-7 所 示 的 词 云图 统计 图 。 
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图 19-7 词 云 图 统计 图 


至 此 ， 就 完成 了 分 词 和 生成 统计 图 的 功能 。 
在 该 项 目 中 也 可 以 生成 更 多 其 他 形式 的 统计 图 ， 也 可 以 将 该 项 目 扩展 为 功能 更 加 强大 的 项 目 ， 
可 以 加 入 写 入 CSV 文件 和 发 送 邮件 ， 加 入 提醒 相关 人 员 对 应 的 信息 的 功能 。 


19.5 ”项目 小 结 


本 章 首 先 介绍 了 几 个 新 的 功能 点 ， 接 着 讲解 了 这 几 个 新 功能 点 的 使 用 方式 。 最 后 使 用 这 些 新 
功能 点 及 前 面 所 学 的 知识 ， 通 过 疏 虫 程序 爬 取 数 据 ， 再 对 数据 进行 分 词 处 理 并 保存 到 数据 库 ， 最 后 
对 各 个 词 做 词 频 统计 及 生成 统计 图 表 。 

该 项 目 也 可 以 加 入 很 多 可 以 扩展 的 功能 ， 有 兴趣 的 读者 可 以 自行 加 入 更 多 功能 ， 形 成 一 个 更 
强大 的 项 目 。 
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第 20 章 
区 块 链 实战 


本 章 将 用 所 学 的 知识 构建 一 个 当下 火热 的 项 目 一 一 区 块 链 。 
20.1 区 块 链 简介 


区 块 链 被 炒 得 火热 ， 让 很 多 企业 趋 之 若 登 。 传 说 中 的 区 块 链 究竟 是 什么 ? 本 节 先 来 介绍 区 块 
链 的 概念 、 特 点 与 应 用 领域 。 


20.1.1 ”区 块 链 的 定义 


区 块 链 是 分 布 式 数据 存储 、 点 对 点 传输 、 共 识 机 制 、 加 密 算法 等 计算 机 技术 的 新 型 应 用 模 
Ee 


狭义 来 讲 ， 区 块 链 是 一 种 按照 时 间 顺 序 将 数据 区 块 以 顺序 相连 的 方式 组 合成 的 一 种 链 式 数据 
结构 ， 并 以 密码 学 方式 保证 不 可 算 改 和 不 可 伪造 的 分 布 式 账本 。 

广义 来 讲 ， 区 块 链 技 术 是 利用 块 链 式 数据 结构 来 验证 与 存储 数据 ， 利 用 分 布 式 节点 共识 算法 
来 生成 和 更 新 数据 , 利用 密码 学 的 方式 保证 数据 传输 和 访问 的 安全 , 利用 由 自动 化 脚本 代码 组 成 的 
智能 合约 来 编程 和 操作 数据 的 一 种 全 新 的 分 布 式 基础 架构 与 计算 方式 。 

最 原始 的 区 块 链 是 一 种 去 中 心 化 的 数据 库 ， 它 包含 一 张 被 称 为 区 块 的 列表 ， 有 着 持续 增长 并 
且 排列 整齐 的 记录 。 每 个 区 块 都 包含 一 个 时 间 戳 和 一 个 与 前 一 个 区 块 的 链接 : 设计 区 块 链 使 得 数据 
不 可 算 改 ,一 旦 记录 下 来 ， 在 一 个 区 块 中 的 数据 将 不 可 北 。 
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20.1.2 ”区 块 链 的 特点 


区 块 链 最 大 的 特点 是 去 中 心 化 ， 由 于 使 用 分 布 式 核算 和 存储 ， 不 存在 中 心 化 的 硬件 或 管理 机 
构 , 因此 任意 节点 的 权利 和 义务 都 是 均等 的 , 系统 中 的 数据 块 由 整个 系统 中 具有 维护 功能 的 节点 来 
共同 维护 。 

此 外 ， 还 有 开放 性 、 自 治 性 、 信 息 不 可 算 改 和 匿名 性 等 特点 。 








20.1.3 ”区 块 链 应 用 行业 及 领域 


区 块 链 的 应 用 行业 非常 广 ， 在 艺术 行业 、 法 律 行业 、 开 发 行业 、 房 地 产 行业 、 保 险 行 业 、 金 
融 行 业 等 都 有 非常 好 的 应 用 场景 。 

区 块 链 可 被 使 用 的 领域 也 非常 多 ， 如 智能 合约 、 证 券 交 易 、 电 子 商 务 、 物 联网 、 社 交通 信 、 
文件 存储 、 存 在 性 证 明 、 身 份 验证 、 股 权 众 筹 等 领域 都 可 以 加 入 区 块 链 的 使 用 。 





20.2 “区 块 链 代码 结构 设计 


本 节 先 进行 区 块 链 开发 的 环境 准备 ， 再 进行 代码 结构 的 设计 。 


20.2.1 环境 准备 


在 开始 开发 之 前 ， 先 做 一 些 环境 配置 上 的 准备 。 此 处 准备 使 用 一 个 Python 的 轻 量 级 框架 
flask，flask 的 安装 很 简单 ， 对 于 Windows 操作 系统 ， 进 入 命令 控制 台 ， 输 入 如 下 命令 : 


C:\Users\lyz>pip install flask 


Linux 和 Mac 操作 系统 安装 flask 的 命令 和 这 个 基本 类 似 ， 网 上 有 很 多 相关 资源 可 以 使 用 。 
还 需要 一 个 HTTP 客户 端 ， 比 如 postman、cURL 或 其 他 客户 端 。 这 里 将 使 用 postman 做 运行 
效果 的 展示 。 





20.2.2 ”代码 结构 设计 


本 示例 使 用 的 是 flask 框架 ， 整 体 框架 的 代码 结构 设计 如 图 20-1 所 示 。 
在 图 20-1 中 ，blockchain 为 项 目 名 称 ，main.py 为 项 目 启动 程序 ，server 为 服务 包 ，views.py 
为 视图 控制 器 ，block_chain.py 为 区 块 链 具 体 实 现代 码 编写 的 文件 ，_init_.py 为 初始 化 脚本 。 
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了 DD blockchain (D:\python\writebook\blockchain) 
了 四 server 
应 _init_.py 
认 block_ chain.py 





图 20-1 代码 结构 设计 
main.py 文件 的 结构 如 下 : 





__init_.py 文件 的 结构 如 下 : 





views.py 框架 的 代码 结构 如 下 : 





block_chain.py 框架 的 代码 结构 如 下 ,创建 一 个 BlockChain 类 ， 用 来 管理 链条 。 在 BlockChain 
类 的 构造 函数 中 初始 化 4 个 对 象 ， 对 应 作用 分 别 如 代码 所 示 : 
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20.3 ”区 块 链 具体 逻辑 实现 


具体 逻辑 实现 在 block_chain.py 文件 中 编写 ， 需 要 实现 加 入 交易 、 创 建新 块 、 计 算 工作 量 等 功 
能 。 在 编写 代码 之 前 ， 先 了 解 区 块 链 的 块 结构 。 


20.3.1 ” 块 结构 


每 个 区 块 包含 的 属性 : 索引 (index) 、UNIX 时 间 惟 (timestamp) 、 交 易 列 表 (transactions) 、 
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工作 量 证 明 〈 稍 后 解释 ) 以 及 前 一 个 区 块 的 Hash 值 。 以 下 是 一 个 区 块 的 结构 : 


和 
用 玉 机 人 四 天 人 二 也 
"previous hash": "c72e43a408cfa7c63e7b4168e0c2d84a0ffbc9957f2e591415c0d4dcb923305f"， 
"proof": 0, 
"timestamp": 1523067788.586708, 
"transactions": [ 
{ 

"amount": 1, 

"recipient": "451e724f207543b8a2531ebdbcflcb45"， 

"sender": "0" 


) 
每 个 新 的 区 块 都 包含 上 一 个 区 块 的 Hash， 这 一 点 很 关键 ， 它 保障 了 区 块 链 的 不 可 变性 。 如 果 
攻击 者 破坏 了 前 面 的 某 个 区 块 ， 那 么 后 面 所 有 区 块 的 Hash 都 会 变 得 不 正确 。 


20.3.2 ”加 入 交易 


第 一 步 需 要 添加 一 个 交易 ， 完 善 new_transaction 方法 如 下 : 


def new transaction(self, sender, recipient, amount): 
mm 


生成 新 交易 信息 ， 信 息 将 加 入 到 下 一 个 待 挖 的 区 块 中 

:param sender: <str> Address of the Sender 

:param recipient: <str> Address of the Recipient 

:param amount: <int> Amount 

:return: <int> The index of the Block that will hold this transaction 


self.current transactions.append({ 
"sender': sender, 
"recipient': recipient, 
‘amount': amount, 


1D) 


return self.last block['index'] + 1 
该 方法 向 列表 中 添加 一 个 交易 记录 ， 并 返回 该 记录 将 被 添加 到 的 区 块 〈 下 一 个 待 挖掘 的 区 块 ) 
的 索引 。 


20.3.3 创建 新 块 


当 BlockChain 实例 化 后 ， 需 要 构造 一 个 创 世 块 〈 没 有 前 区 块 的 第 一 个 区 块 ) ， 并 给 它 加 上 一 
个 工作 量 证 明 。 每 个 区 块 都 需要 经 过 工作 量 证 明 。 为 了 构造 创 世 块 ， 要 完善 new_block()、 
new_transaction() 和 hash() 方 法 ， 完 善 代 码 如 下 : 


def new block(self, proof, previous hash=None): 


生成 新 块 
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通过 代码 和 注释 可 以 对 区 块 链 有 直观 的 了 解 ， 接 下 来 看 区 块 是 怎么 挖 出 来 的 。 
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20.3.4 工作 量 证 明 的 理解 


新 的 区 块 依赖 工作 量 证 明 算法 (PowW ) 来 构造 ，PoW 的 目标 是 找 出 一 个 符合 特定 条 件 的 数字 ， 
这 个 数字 很 难 计算 出 来 ， 但 容易 验证 。 这 就 是 工作 量 证 明 的 核心 思想 。 

为 了 方便 理解 ， 举 个 例子 : 假设 一 个 整数 x 乘 以 另 一 个 整数 y 的 积 的 Hash 值 必须 以 0 结尾 ， 
即 hash(x*y)Fac23dc…0， 设 变量 x=5， 求 y 的 值 。 用 Python 实现 如 下 : 





from hashlib import sha256 

X= 5 

y=0 #y 未 知 

while sha256(f'{x*y}' .encode ()) .hexdigest() [-1] != "0": 
y += 工 

Print (f'The solution is y= {y}') 


结果 是 y=21。 因 为 : 
hash(5 * 21) = 1253e9373e...5e3600155e860 


在 比特 币 中 使 用 称 为 Hashcash 的 工作 量 证 明 算法 ， 和 上 面 的 问题 很 类 似 。 矿 工 们 为 了 争夺 创 
建 区 块 的 权利 而 争 相 计算 结果 。 通 常 ， 计 算 难 度 与 目标 字符 串 需 要 满足 的 特定 字符 的 数量 成 正比 ， 
矿工 算出 结果 后 ， 会 获得 比特 币 奖励 。 


20.3.5 工作 量 证 明 的 实现 


下 面 实现 一 个 相似 PoW 算法 ， 规 则 是 : 寻找 一 个 数 p， 使 得 它 与 前 一 个 区 块 的 proof 拼接 成 
的 字符 串 的 Hash 值 以 4 个 0 开头 。 


def proof of work(self, last proof): 

wm 

简单 的 工作 量 证 明 : 

- 查找 一 个 p' 使 得 hash (pp') 以 4 个 0 开头 

- P 是 上 一 个 块 的 证 明 ， p， 是 当前 的 证 明 

:param last proof: <int> 

:return: <int> 

wm 

proof = 0 

while self.valid proof (last proof, proof) is False: 
proof += 1 


return proof 


@staticmethod 
def valid proof(last proof, proof): 
验证 证 明 : 是 否 hash (last_proof，proof) 以 4 个 0 开头 ? 
:Param last proof: <int> Previous Proof 
:param proof: <int> Current Proof 
:return: <bool> True if correct, False if not. 


mm 
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guess = f'{last proof} {proof}' .encode() 
guess hash = hashlib.sha256 (guess) .hexdigest () 
return guess hash[:4] == "0000" 


衡量 算法 复杂 度 的 办 法 是 修改 以 0 开头 的 个 数 。 使 用 4 个 0 来 用 于 演示 ， 这 里 每 多 一 个 0 都 
会 大 大 增加 计算 出 结果 所 需 的 时 间 。 现 在 BlockChain 类 基本 已 经 完成 了 , 接 下 来 使 用 HTTP Requests 
进行 交互 。 


20.4 API 接口 层 开 发 


Python Flask 是 一 个 轻 量 级 Web 应 用 框架 ， 它 方便 将 网 络 请 求 映 射 到 Python 函数 ， 现 在 我 们 
来 让 BlockChain 运行 在 基于 Flask 的 Web 上 。 
创建 以 下 三 个 接口 : 
(1) /transactions/new 创建 一 个 交易 并 添加 到 区 块 。 
(2) /mine 告诉 服务 器 去 挖掘 新 的 区 块 。 
(3) /chain 返回 整个 区 块 链 。 





20.4.1 发 送 交 易 


前 面 已 经 有 加 入 交易 的 方法 ， 基 于 接口 来 加 入 发 送 交 易 的 实现 如 下 : 


@app.route('/transactions/new', methods=['POST']) 
def new transaction(): 
values = request.get json() 


# Check that the required fields are in the POST'ed data 
required = ['sender', 'recipient', ‘'amount'] 
if not all(k in values for k in required): 

return "Missing values', 400 


# Create a new Transaction 
index = blockchain.new transaction(values['sender'], values['recipient'], 
values['amount ']) 


response = {'message': f'Transaction will be added to Block {index}'} 
return jsonify (response), 201 


发 送 到 节点 的 交易 数据 结构 如 下 : 
{ 


"sender": "my address", 

"recipient": "someone else's address", 
"amount": 5 

} 
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20.4.2 ” 挖 矿 


挖 矿 正 是 区 块 链 的 神奇 所 在 ， 它 很 简单 ， 做 了 以 下 三 件 事 : 
(1) 计算 工作 量 证 明 PoW。 
(2) 通过 新 增 一 个 交易 授予 矿工 (自己 ) 一 个 币 。 
(3) 构造 新 区 块 并 将 其 添加 到 链 中 。 

挖 矿 接口 实现 如 下 : 





此 处 交易 的 接收 者 是 我 们 自己 的 服务 器 节点 。 


20.4.3 ”返回 整个 区 块 链 
经 过 加 入 交易 和 挖 矿 后 ， 需 要 返回 整个 区 块 链 。 返 回 区 块 链 的 接口 实现 如 下 : 
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20.5 “运行 区 块 链 


经 过 前 面 的 准备 后 ， 我 们 的 区 块 链 整体 代码 就 开发 完成 了 ， 接 下 来 运行 代码 来 看 效果 。 使 用 
cURL 或 postman 和 API 进行 交互 ， 启 动 main.py， 如 图 20-2 所 示 。 


丽 C\Windowsysystem32\cmd.exe - python main.py EE 





图 20-2 启动 main.py 


服务 启动 后 ， 打 开 postman， 输 入 请 求 http://localhost:5000/mine 进行 挖 矿 。 
若 挖 矿 成 功 ， 则 可 以 看 到 如 图 20-3 所 示 的 结果 。 











c86e7e144e8eb879blflec549366"， 














图 20-3 挖 矿 


通过 POST 请 求 添加 一 个 新 交易 。 
若 交易 加 入 成 功 ， 则 返回 如 图 20-4 所 示 的 结果 。 











”message": ”Transaction will be added to 6: 














| 








204 ”加 入 交易 
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发 送 POST 请 求 时 ， 注 意 Headers 参数 的 设置 ， 如 果 没 有 正确 设置 Headers 参数 ， 请 求 就 会 直 
接 报错 ， 正 确 的 请 求 参数 设置 如 图 20-5 所 示 。 





POST hapniocalhosr5000/rransactions/new 





20-5 Headers 参数 设置 


如 果 不 使 用 postman， 使 用 cURL 的 方式 如 下 : 


$ curl -X POST -H "Content-Type: application/json" -d '{ 

"sender": "d4ee26eeel5148ee92c6cd394edd974e", 

"recipient": "someone-other-address", 

"amount": 5 

}' "http://localhost:5000/transactions/new" 

若 交 易 加 入 成 功 ， 也 会 返回 如 图 20-4 所 示 的 结果 。 

挖 了 一 次 矿 之 后 ， 就 有 2 个 块 了 ， 在 postman 中 发 送 请 求 http://localhost:5000/chain 可 以 得 到 
所 有 块 的 信息 。 

若 请 求 成 功 ， 则 会 得 到 如 图 20-6 所 示 的 结果 。 

















图 20-6 ”区 块 链 结果 





20.6 分布 式 实现 


现在 已 经 有 了 一 个 基本 的 区 块 链 可 以 接受 交易 和 挖 矿 ， 但 是 区 块 链 系统 应 该 是 分 布 式 的 。 既 
然 是 分 布 式 的 , 那么 我 们 究竟 用 什么 保证 所 有 节点 有 同样 的 链 呢 ? 这 就 是 一 致 性 问题 , 我 们 要 想 在 
网 络 上 有 多 个 节点 ， 就 必须 实现 一 个 一 致 性 的 算法 。 
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20.6.1 注册 节点 


在 实现 一 致 性 算法 之 前 ， 我 们 需要 找到 一 种 方式 让 一 个 节点 知道 它 相 邻 的 节点 。 每 个 节点 都 
需要 保存 一 份 包含 网 络 中 其 他 节点 的 记录 。 实 现 block_chain.py 中 的 register_node 方法 ， 完 善 代 码 
如 下 : 





20.6.2 ”实现 共识 算法 


前 面 提 到 ， 冲 突 是 指 不 同 的 节点 拥有 不 同 的 链 ， 为 了 解决 这 个 问题 ， 规 定 最 长 的 、 有 效 的 链 
才 是 最 终 的 链 , 换 旬 话说 , 网 络 中 的 有 效 最 长 链 才 是 实际 的 链 。 使 用 以 下 算法 来 达到 网 络 中 的 共识 。 
继续 完善 代码 如 下 : 
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第 一 个 方法 valid_chain0 用 来 检查 是 否 是 有 效 链 ， 遍 历 每 个 块 验证 hash 和 proof; 第 二 个 方法 
resolve_conflicts() 用 来 解决 冲突 ， 遍 历 所 有 的 邻居 节点 ， 并 用 valid_chain0 方 法 检查 链 的 有 效 性 ， 
如 果 发 现 有 更 长 链 ， 就 替换 掉 自己 的 链 。 

添加 两 个 路 由 ， 一 个 用 来 注册 节点 ， 另 一 个 用 来 解决 冲突 。 
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register_nodes 用 于 注册 节点 ，consensus 用 来 解决 冲突 。 


20.7 ”完整 项 目 代码 与 执行 


经 过 前 面 几 个 小 节 的 讲解 ， 本 节 将 完整 展现 区 块 链 示 例 的 代码 与 操作 执行 。 
main.py 完整 代码 如 下 : 





__init .py 完整 代码 如 下 : 





views.py 完整 代码 如 下 : 
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block_chain.py 完整 代码 如 下 : 
importhashlip 
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示例 代码 写 在 valid_proof 方法 中 ， 为 便于 测试 查看 效果 ，guess_hash 没有 设置 成 难 算 的 值 。 
在 一 台 机 器 开启 不 同 的 网 络 端口 来 模拟 多 节点 的 网 络 ， 在 不 同 的 终端 运行 命令 ， 启 动 两 个 节 
点 : http://localhost:5000 和 http://localhost:6000。 此 处 将 端口 号 为 5000 的 节点 命名 为 节点 1， 将 端 
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口号 为 6000 的 节点 命名 为 节点 2。 





节点 1 已 经 在 前 面 开启 了 ， 现 在 开启 节点 2， 开 启 方式 如 图 20-7 所 示 。 


而 C\Windows\system32\cmd.exe - python main.py -p 6000 Lo © m3 








图 20-7 开启 端口 号 6000 的 节点 


节点 2 加 入 交易 ， 如 图 20-8 所 示 。 











ill be added to Block {index}" 








图 20-8 节点 2 加 入 交易 


4 


点 2 进行 挖 矿 ， 如 图 20-9 所 示 。 








376f79bed4b576"， 





图 20-9 节点 2 挖 矿 





节点 2 返回 整个 区 块 链 ， 如 图 20-10 所 示 。 
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图 20-10 节点 2 返回 区 块 链 





以 POST 请 求 执行 http://localhost:5000/nodes/register， 请 求 参 数 如 下 : 


{ 


"nodes":["http://localhost:6000"] 


} 


在 postman 中 执行 ， 得 到 如 图 20-11 所 示 的 结果 。 


"nodes":["http 








I 

2 message”: “New nodes have been added", 
“total nodes": [ 

4 "localhost: 60080" 

加 1 

5 ) 


//10calhost:6000"] 





图 20-11 节点 2 注册 到 节点 1 


当前 在 节点 1 上 有 一 个 区 块 ， 节 点 2 上 有 一 个 区 块 ， 并 且 已 经 将 节点 2 注册 到 节点 1。 
在 节点 2 上 挖 两 个 块 ， 挖 矿 结果 如 图 20-12 所 示 。 















"New Block Forged", 


": "d295b2cb297fea52a5de9cac163e8d84f8c69125f7eca5ae569555cf2a47869d"， 


c154c8e316354b6986d5366532d9dc5f"， 





图 20-12 在 节点 2 上 挖 第 二 个 块 
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得 到 节点 2 的 所 有 区 块 情况 ， 如 图 20-13 所 示 。 





-EE 


pa 





中 
了 
= 
IE 


index": 3, 
“previous_hash": 
"d265b2cb297fea52a5de9cac163e8d84f8c69126f7eca5ae6689655cf2a47e69d"， 





了 ET 


图 20-13 挖 矿 两 次 后 节点 2 所 有 区 块 
区 块 2 所 有 节点 的 内 容 如 下 : 
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{ 
"amount": 1, 
"recipient": "cl54c8e316354b6980d6300532d9dc5f", 
"sender": "0" 

} 


} 
]， 
"length": 3 
} 


查看 节点 1， 结 果 如 图 20-14 所 示 。 


















20-14 节点 1 的 整个 区 块 链 
接 下 来 在 节点 1 上 以 GET 请求 访 问 接口 http:Wlocalhost:5000/nodes/resolve, 执行 结果 如 图 20-15 
所 示 。 





"transactions": [] 


vindex": 2, 
“previous_hash”: 
4a62861ae8249f17d59594ec71142c9875cb7c8665211fcd598378f79bed4b578"， 
”proof ": 
"timesta 
"transactit 







1524231417.9389713, 








图 20-15 解决 节点 1 执行 冲突 
执行 结果 打印 的 message 内 容 为 : Our chain was replaced。 该 结果 的 意思 为 节点 1 的 链 通 过 共 
识 算法 被 节点 2 的 链 取代 。 解 决 冲突 后 得 到 区 块 1 的 内 容 如 下 : 


"message": "Our chain was replaced", 


"new_chain": [ 
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查看 节点 1 的 整个 区 块 链 ， 如 图 20-16 所 示 。 
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”previous_hashr: 
"d295b2cb297fea52a5degcac163e8d84f8c69126f7eca5ae689655cf2347e69d"， 

rproof": 8， 

"timestamp": 1524231832.365827, 


"transactions": [ 


ramount"; 1, 
"recipient": "c154c8e316354b6988d6398532d9dcSf", 
"sender": “8" 








图 20-16 节点 1 的 整个 区 块 链 
区 块 1 的 完整 节点 内 容 如 下 : 
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"recipient": "cl54c8e316354b6980d6300532d9dc5f", 
"sender":; "0" 


] 

} 
]， 
"length": 3 


查看 结果 看 到 ， 节 点 1 已 经 和 节点 2 的 区 块 内 容 达 到 一 致 。 


20.8 项 目 小 结 


本 章 简单 地 讲解 了 区 块 链 的 构建 和 区 块 链 的 分 布 式 执行 方式 ， 大 家 可 以 依据 这 些 源 码 做 进 一 
步 的 修改 ， 以 达到 自己 想 要 的 执行 结果 。 




















函数 返回 值 (描述 ) 

abs(x) 返回 数字 的 绝对 值 ， 如 abs(-10) 返回 10 

ceil(x) 返回 数字 的 上 入 整数 ， 如 math.ceil(4.1) 返回 5 

cmp(x, y) 如 果 x<y 就 返回 -1， 如 果 x==y 就 返回 0， 如 果 x>y 就 返回 1 
exp(x) 返回 e 的 x 次 守 (es)， 如 math.exp(D) 返回 2.718281828459045 
fabs(x) 返回 数字 的 绝对 值 ， 如 math.fabs(-10) 返回 10.0 

floor(x) 返回 数字 的 下 使 整数 ， 如 math.floor(4.9) 返 回 4 

log(x) 如 math.log(math.e) 返 回 1.0，math.log(100,10) 返 回 2.0 

log10(%) 返回 以 10 为 基数 的 x 的 对 数 ， 如 math.log10(100) 返 回 2.0 


max(x1, x2,…) ”| 返回 给 定 参数 的 最 大 值 ， 参 数 可 以 为 序列 





min(x1, x2,...) 返回 给 定 参数 的 最 小 值 ， 参 数 可 以 为 序列 

















modf(x) 返回 x 的 整数 部 分 与 小 数 部 分 ， 两 部 分 的 数值 符号 与 x 相同， 整数 部 分 以 浮 点 型 表示 
pow(%, y) x**y 运算 后 的 值 

round(x Cn]) 返回 浮 点 数 x 的 四 舍 五 入 值 ， 如 给 出 n 值 ， 代 表 舍 入 到 小 数 点 后 的 位 数 

sqrt(x) 返回 数字 x 的 平方 根 ， 数 字 可 以 为 负数 ， 返 回 类 型 为 实数 ， 如 math.sqrt(4) 返 回 2.0 


A.2 随机 隔 数 





函数 描述 
ep 从 序列 的 元 素 中 随机 挑选 一 个 元 素 ， 如 random.choice(range(10))， 从 0 一 9 中 随 
机 挑选 一 个 整数 





randrange ([start] stop [step]) | 从 指定 范围 按 指定 基数 递增 的 集合 获取 一 个 随机 数 ， 基 数 默认 值 为 1 












































( 续 表 ) 
函数 描述 
random() | 随机 生成 一 个 实数 ， 在 [0,1) 范 围 内 
改变 随机 数 生 成 器 的 种 子 (seed)。 如 果 不 了 解 原理 ,就 不 必 特 意 设 定 seed, Python 
a 会 帮 你 选择 seed 
shufnedlsb) | 将 序列 所 有 元 素 随 机 排序 
uniform(x, y) 随机 生成 一 个 实数 ， 在 [xy] 范 围 内 
A.3 三 角 函 数 
函数 描述 
acos(x) 返回 x 的 反 余弦 弧度 值 
asin(x) 返回 x 的 反正 弦 弧 度 值 
atan(x) 返回 x 的 反正 切 弧度 值 
atan2(y, x) 返回 给 定 的 x 及 y 坐标 值 的 反正 切 值 
cos(x) 返回 x 弧度 的 余弦 值 
hypot(x, y) 返回 欧 几 里 得 范 数 sqrt(x*x +y*y) 
sin(x) 返回 x 弧度 的 正弦 值 
tan(x) 返回 x 弧度 的 正切 值 
degrees(x) 将 弧度 转换 为 角度 ， 如 degrees(math.pi/2) 返 回 90.0 
radians(x) 将 角度 转换 为 弧度 
A.4 ”Python 字符 串 内 建 函 数 
序号 方法 及 描述 
1 capitalize0， 将 字符 串 的 第 一 个 字符 转换 为 大 写 
2 center(width, fillchar) 返 回 一 个 指定 宽度 width 居中 的 字符 串 ，fillchar 为 填充 的 字符 ， 默 认为 空格 





count(str, beg= 0,end=len(string)) 返 回 str 在 string 里 出 现 的 次 数 ， 如 果 beg 或 end 指定 , 就 返回 指 
定 范围 内 str 出 现 的 次 数 





4 decode(encoding=UTF-8',errors='strict) 使 用 指定 编码 解码 字符 串 。 默 认 编 码 为 字符 串 编码 





encode(encoding=UTF-8',errors='strict) 以 encoding 指定 的 编码 格式 编码 字符 串 ， 如 果 出 错 ， 默 认 报 
一 个 ValueEror 异常 ， 除 非 errors 指定 的 是 ignore 或 者 replace 





endswith(suffix, beg=0, end=len(string)) 检 查 字符 串 是 否 以 obj 结束 。 如 果 beg 或 end 指定 ， 就 检查 
指定 的 范围 内 是 否 以 obj 结束 。 如 果 是 ， 就 返回 True; 否则 返回 False 





























7 expandtabs(tabsize=8) 把 字符 串 string 中 的 tab 符号 转 为 空格 ，tab 符号 默认 的 空格 数 是 8 
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序号 “| 方法 及 描述 

find(str, beg=0 end=len(string)) 检 测 str 是 否 包含 在 字符 串 中 。 如 果 beg 和 end 指定 范围 ,就 检查 是 
否 包 含 在 指定 范围 内 。 如 果 是 ， 就 返回 开始 的 索引 值 ， 否 则 返回 -1 

9 index(str, beg=0, end=len(string)) 跟 find0 方 法 一 样 ， 只 不 过 如 果 str 不 在 字符 串 中 ， 就 会 报 一 个 异常 

10 isalnum(), 如 果 字 符 串 中 至 少 有 一 个 字符 并 且 所 有 字符 都 是 字母 或 数字 , 就 返回 True; 否则 返回 False 

11 isalpha0， 如 果 字 符 串 中 至 少 有 一 个 字符 且 所 有 字符 都 是 字母 ， 就 返回 True; 否则 返回 False 

12 isdigit0， 如 果 字 符 串 中 只 包含 数字 ， 就 返回 Tme; 否则 返回 False 

六 islower()， 如 果 字 符 串 中 至 少 包 含 一 个 区 分 大 小 写 的 字符 , 并 且 所 有 字符 (区 分 大 小 写 ) 都 是 小 写 的 ， 
就 返回 True; 否则 返回 False 

14 isnumeric0， 如 果 字符 串 中 只 包含 数字 字符 ， 就 返回 Tme; 否则 返回 False 

15 isspace0， 如 果 字 符 串 中 只 包含 空格 ， 就 返回 Trme; 否则 返回 False 

16 istitle()， 如 果 字 符 串 是 标题 化 的 〈 见 title0， 第 36 个 ) ， 就 返回 Tme; 否则 返回 False 

测 isupper(0)， 如 果 字 符 串 中 至 少 包 含 一 个 区 分 大 小 写 的 字符 , 并 且 所 有 字符 (区 分 大 小 写 ) 都 是 大 写 的 ， 
就 返回 True; 否则 返回 False 

18 join(seq)， 以 指定 字符 串 作为 分 隔 符 ， 将 seq 中 所 有 元 素 〈 字 符 串 类 型 的 元 素 ) 合并 为 一 个 新 字符 串 

19 len(string)， 返 回 字 符 串 长 度 

ljust(width[, fillchar]), 返回 左 对 齐 的 原 字符 串 , 并 使 用 fillchar 填充 至 长 度 width 的 新 字符 串 , fillchar 
默认 为 空格 

21 lower0， 转 换 字符 串 中 所 有 大 写字 符 为 小 写 

2 lstrip0， 截 掉 字 符 串 左边 的 空格 

全 maketrans0, 创建 字符 映射 的 转换 表 , 对 于 接收 两 个 参数 的 最 简单 的 调用 方式 , 第 一 个 参数 是 字符 串 ， 
表示 需要 转换 的 字符 ， 第 二 个 参数 也 是 字符 串 ， 表 示 转 换 的 目标 

24 max(stm)， 返 回 字符 串 str 中 最 大 的 字母 

25 min(str)， 返 回 字符 串 str 中 最 小 的 字母 

26 replace(old, new [, max])， 将 字符 串 中 的 old 替换 成 new。 如 果 max 指定 ， 替 换 就 不 超过 max 次 

27 rfind(str, beg=0,end=len(string))， 类 似 于 find() 函 数 ， 不 过 是 从 右边 开始 查找 

28 rindex( str, beg=0, end=len(string))， 类 似 于 index0 函 数 ， 不 过 是 从 右边 开始 查找 

i tjust(width,[, fillchar])， 返 回 右 对 齐 的 原 字符 串 ， 并 使 用 fillchar 默认 空格 ) 填充 至 长 度 width 的 新 
字符 串 

30 rstrip0， 删 除 字符 串 末 尾 的 空格 

a split(str="", num=string.count(str))，num=string.count(str)) 以 str 为 分 隔 符 截取 字符 串 。 如 果 num 有 
指定 值 ， 就 仅 截取 num 个 子 字符 串 

3 splitlines( num=string.count(m))， 按 照 行 分 隔 ， 返 回 一 个 包含 各 行 元 素 的 列表 。 如 果 num 指定 ， 就 
仅 切 片 num 行 

六 startswith(str, beg=0,end=len(string)), 检查 字符 串 是 否 以 obj 开头 ,若是 就 返回 True, 否则 返回 False。 
如 果 beg 和 end 为 指定 值 ， 就 在 指定 范围 内 检查 

34 strip([chars])， 在 字符 串 上 执行 Istrip0 和 rstrip() 





35 





swapcase()， 将 字符 串 中 的 大 写 转换 为 小 写 ， 小 写 转换 为 大 写 
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( 续 表 ) 
序号 “| 方法 及 描述 
本 title0， 返 回 “ 标 题 化 ”的 字符 串 ， 就 是 所 有 单词 都 以 大 写 开 始 ， 其 余 字母 均 为 小 写 〈 见 istitle0 第 16 
个 ) 
本 translate(table，deletechars="")， 根 据 str 给 出 的 表 (包含 256 个 字符 ) 转换 string 的 字符 ， 将 要 过 
滤 的 字符 放 到 deletechars 参数 中 
38 upper0， 转 换 字符 串 中 的 小 写字 母 为 大 写 
39 zfill (width)， 返 回 长 度 为 width 的 字符 串 ， 原 字符 串 右 对 齐 ， 前 面 填充 0 
40 isdecimal()， 检 查 字 符 串 是 否 只 包含 十 进 制 字符 ， 如 果 是 就 返回 True， 和 否则 返回 False 
A.5 列表 方法 
序号 
1 listappend(obj)， 在 列表 末尾 添加 新 对 象 
2 listcount(obj)， 统 计 某 个 元 素 在 列表 中 出 现 的 次 数 
3 list.extend(seq)， 在 末尾 一 次 性 追加 另 一 个 序列 中 的 多 个 值 〈 用 新 列表 扩展 原来 的 列表 》) 
4 listindex(obj)， 从 列表 中 找 出 某 个 值 第 一 个 匹配 项 的 索引 位 置 
5 list.insert(index, obj)， 将 对 象 插入 列表 
6 listpop(obj=listL-1])， 移 除 列表 中 的 一 个 元 素 (默认 为 最 后 一 个 )， 并 返回 该 元 素 的 值 
7 listremove(obj)， 移 除 列 表 中 某 个 值 的 第 一 个 匹配 项 
8 listreverse0， 反 向 列表 中 的 元 素 
9 list.sort([func])， 对 原 列表 进行 排序 
10 list.clear()， 清 空 列表 
11 listcopy0， 复 制 列 表 
A.6 字典 内 置 方法 
序号 函数 及 描述 
1 radiansdict.clear0， 删 除 字 典 内 所 有 元 素 
2 Tadiansdictcopy0， 返 回 一 个 字典 的 浅 复制 
radiansdict fromkeys0， 创 建 一 个 新 字典 ， 以 序列 seq 中 的 元 素 做 字典 的 键 ，val 为 字典 所 有 键 对 应 
的 初始 值 
4 radiansdict.get(key, default=None)， 返 回 指定 键 的 值 ， 如 果 值 不 在 字典 中 ， 就 返回 default 
. key in dict， 如 果 键 在 字典 dict 里 ， 就 返回 tue， 否 则 返回 false 
6 radiansdict.items()， 以 列表 返回 可 遍历 的 元 组 数组 ( 键 ， 值 ) 
ed radiansdictkeys0， 以 列表 返回 一 个 字典 的 所 有 键 
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序号 函数 及 描述 
和 radiansdict.setdefault(key, default=None)， 和 get0 类 似 ， 如 果 键 不 存在 于 字典 中 ， 就 会 添加 键 并 将 值 

设 为 default 
9 radiansdict.update(dict2)， 把 字典 dict2 的 键 / 值 对 更 新 到 dict 里 
10 Tadiansdict values0， 以 列表 返回 字典 中 的 所 有 值 

A.7 正则 表达 式 模 式 
模式 描述 
A 匹配 字符 串 的 开头 
$ 匹配 字符 串 的 末尾 
3 匹配 任意 字符 ， 除 了 换行 符 外 。 当 re.DOTALL 标记 被 指定 时 ， 可 以 匹配 包括 换行 符 的 任意 字符 
Ed 用 来 表示 一 组 字符 ， 单 独 列 出 : [amk] 匹配 'a'm 或 kk 
[ 愉 .] 不 在 [中 的 字符 : [^abc] 匹配 除了 a、b、c 之 外 的 字符 
re* 匹配 0 个 或 多 个 表达 式 
ret 匹配 1 个 或 多 个 表达 式 
re? 匹配 0 个 或 1 个 由 前 面 的 正则 表达 式 定义 的 片段 ， 非 灸 禁 方 式 
re{ n,} 精确 匹配 前 面 n 个 表达 式 
re{n,m} | 匹配 n 到 m 次 由 前 面 的 正则 表达 式 定义 的 片段 ， 贪 禁 方式 
alb 匹配 a 或 b 
(re) 匹配 括号 内 的 表达 式 ， 也 表示 一 个 组 
(Vimx) 正则 表达 式 包含 3 种 可 选 标 志 : i、m、x _。 只 影响 括号 中 的 区 域 
(7-imx) 正则 表达 式 关 闭 i、m、x 可 选 标 志 。 只 影响 括号 中 的 区 域 
CQ:re) 类 似 于 (…)， 但 不 表示 一 个 组 
(Yimx: re) | 在 括号 中 使 用 i、m、x 可 选 标志 
(?-imx: re) | 在 括号 中 不 使 用 i、m、x 可 选 标志 
(3#...) 注释 
全 前 向 肯定 界定 符 。 如 果 所 含 正则 表达 式 以 … 表示 , 在 当前 位 置 成 功 匹配 时 就 会 成 功 ， 否 则 失败 。 
一 旦 所 含 表达 式 已 经 尝试 ， 匹 配 引擎 根本 没有 提高 ， 模 式 的 剩余 部 分 还 要 尝试 界定 符 的 右边 

(2!re) 前 向 否定 界定 符 。 与 肯定 界定 符 相 反 ， 当 所 含 表 达 式 不 能 在 字符 串 当前 位 置 匹配 时 成 功 
(?>re) 匹配 的 独立 模式 ， 省 去 回溯 
\Ww 匹配 字母 数字 
\VW 匹配 非 字 母 数字 
's 匹配 任意 空白 字符 ， 等 价 于 [wmef 
'S 匹配 任意 非 空 字符 
\d 匹配 任意 数字 ， 等 价 于 [0-9] 






































( 续 表 ) 
模式 描述 
D 匹配 任意 非 数字 
WA 匹配 字符 串 开 始 
4 匹配 字符 串 结束 ， 如 果 存 在 换行 ， 就 只 匹配 到 换行 前 的 结束 字符 串 
忆 匹配 字符 串 结束 
\G 匹配 最 后 完成 的 位 置 
吕 匹配 一 个 单词 边界 ， 也 就 是 单词 和 空格 间 的 位 置 。 例 如 ， 'enb' 可 以 匹配 "never" 中 的 'er， 但 不 
能 匹配 "verb" 中 的 'er 
\B 匹配 非 单 词 边界 。'en\B' 能 匹配 "verb" 中 的 'er， 但 不 能 匹配 "never" 中 的 'er' 
mt mn 匹配 一 个 换行 符 ，\t 匹配 一 个 制 表 符 
\1.9 匹配 第 n 个 分 组 的 子 表达 式 


